Figura N°01: Sistema de Gestión de Datos Esquema del MIT (Massachusetts Institute of Technology – Cambridge Estados Unidos)
Hoy, sin embargo, la mayoría de los datos no cumplen los cri- terios básicos de los denominados "datos correctos". Las ra- zones incluyen no conocer el origen de los datos, equipos de medición mal calibrados, procedimientos demasiado comple- jos y errores humanos como el desconocimiento del proceso a estudiar. Como compensación, el ingeniero de proceso debe limpiar los datos antes de entrenar el modelo predictivo. Este es un trabajo tedioso y arduo que ocupa el 80%del tiempo to- tal de la evaluación.
en un periodo de tiempo y estableciendo las condiciones de estu- dioyalcancedel proceso. ParaestemodelodeaplicacióndeMachineLearningenunProceso deFlotación, podemosconsiderar lasvariablesqueafectancomún- menteauncircuitodeflotacióndecobre,comoporejemplo,pueden ser lasMinerasdelSurdelPerúcomoAntapaccay,CerroVerde,Chi- nalco,Hudbay,Bambas, etc;delascualesdebemosdefinir lascondi- cionesde tonelajes; rangodeoxidacióndemineral (%tox); rangode %Cu; granulometrías; rangodepHydemásvariablesquedepende- rándelobjetivoaanalizarenunprocesodeflotación. Todo esto permitirá reducir el número de registros iniciales, por ejemplo, para esta aplicación en un proceso de flotación de cobre, se pudo reducir de 6594 a 1780 registros que realmente tienen la denominación de “datos correctos” y que sirven para el siguiente paso, que es el uso del Algoritmo de Árbol de Decisión por Regre- siónAprendizajeSupervisadoMachineLearning.
Visualización de Datos
En la figura N°02 se muestra la visualización de datos originales donde se puede usar un formato condicional de valor estadístico para identificar valores fueradecontrol, fueradeespecificacióny residuosgrandes.Teniendocomopremisaprincipalelconocimien- todecualquier procesodeflotación, sedebe realizar enprimer lu- gar la limpieza y segmentación de datos, la cual debe ser definida
Figura N°02: Visualización de datos originales de 4 Variables de 12. Se usó un formato condicional de valor estadístico para identificar valores fuera de control, fuera de especificación y residuos grandes.
Made with FlippingBook Annual report maker