RM141

ARTÍCULO TÉCNICO

ESTIMACIÓNDELADOSIFICACIÓNDE REACTIVOSPARAMEJORARLARECUPERACIÓN ENUNPROCESODEFLOTACIÓNMEDIANTE ELALGORITMODEÁRBOLDEDECISIÓNPOR REGRESIÓNAPRENDIZAJESUPERVISADO MACHINELEARNING

Ing. Pedro Castellares Torres Estudiante del Massachusetts Institute of Technology (MIT), Cambridge - Senior Metallurgist Plant - Black, Green y Yellow Belt Lean Six Sigma-UP (Triple Certificación) - Data Mining Análisis de Datos (UPC) - Gestión por Procesos (UP) - Colegiado y Titulado de la Universidad Nacional de Ingeniería CIP 138400

RESUMEN El mayor valor que puede obtener una empresa al utilizar la minería de datos o al utilizar un análisis de datos más pro- fundo está relacionado con la predicción de determinados escenarios con mayor precisión, pero uno de los errores más comunes para las organizaciones que están pensando en im- plementar Machine Learning o Data Mining, tienen que ver con dos extremos. Un extremo es aquel que dice: "No esta- mos seguros de que esto realmente va a funcionar" y el otro extremo es que "va a funcionar perfectamente". Debemos tener muy en cuenta que el mundo de Machine Learning, es un mundo probabilístico, no es un mundo determinístico. En- tonces, es importante entender que se está cambiando de un paradigma F(Xi)= C+aXi + bXi + ... +zXi, a un paradigma donde se hace un entrenamiento de un algoritmo. En otras palabras, el Machine Learning se centra en buscar patrones para ela- borar predicciones. Los algoritmos que se utilizan dependen muchísimo del tipo de datos que se está analizando y del tipo de resultado que se está tratando de predecir o de analizar. Por lo tanto, cada proceso es diferente, donde tenemos unos datos para analizar y que se requieren realizar una explora- ción profunda de esos datos. En ese sentido, no es uno el que decide cuál es el algoritmo a usar, sino que son los datos los que determinan el algoritmo que produce los resultados ba- sados en los datos que existen. Para la estimación de la dosificación de reactivos ymejorar la re- cuperaciónen cualquier procesodeflotación, es posibleaplicar el AlgoritmodeÁrboldeDecisiónporRegresiónmedianteunApren- dizaje Supervisado, ya que son una forma de representación sen- cillaparaencontrargruposhomogéneossegúnunaciertavariable de respuesta. Esta técnica permite representar de forma gráfica una serie de reglas sobre la decisión que se debe tomar en función a una característica principal definida por el algoritmo (nodo

primario) y puede aplicarse para las siguientes variables en un proceso de flotación, como son:

•Dosificacióndel ColectorPrimario •DosificacióndeColectorSecundario •DosificacióndeEspumantePrimario •DosificacióndeEspumanteSecundario •DosificacióndeCal

•DosificacióndeDispersantes •%Sólidosen lapulpaRoScv •P80al CircuitodeFlotación •TipodeMineral, etc.

Este algoritmo puede ser aplicado en diferentes softwares, como Python,StudioR,MatLab,C/C++,CARTRegresión,XLSTAT, etc. OBJETIVO 1. Estimar lasdosificacionesadecuadasde reactivosparamejorar la recuperación de cualquier proceso de flotación, mediante la aplica- ción del Algoritmo de Árbol de Decisión por Regresión de Aprendi- zajeSupervisadoMachineLearning. DESARROLLODEL ALGORITMODEÁRBOL DEDECISIÓNPOR REGRESIÓNAPRENDIZAJE SUPERVISADOMACHINE LEARNING

Sistema de Gestión de Datos

El sistema de gestión de datos es la herramienta básica que da soporte a todas las tareas relacionadas con el aprendizaje au- tomático (machine Learning). Gracias a este sistema, podemos obtener los datos que constituyen el punto de partida de esta disciplina, y solo a través de él podemos lograr los objetivos pro- puestos y tomar decisiones basándonos en los datos. La figura N°01 muestra los tres elementos básicos de un sistema de ges- tión de datos que deben ser considerados de suma importancia por las actuales empresas.

236 . 237

Made with FlippingBook Annual report maker