83
Generación de talento Big Data en España
lítica avanzada, negocio y tecnología, en este orden de importancia. Los principales conocimientos que se han de adquirir por tipología: Conocimientos en matemática aplicada/estadística (conocimientos avanzados de todas las categorías y tipologías de análisis): Modelos probabilísticos (contraste de hipótesis, modelos lineales, mo- delos bayesianos). Análisis y predicción de series temporales (modelos lineales y no li- neales). Modelos de aprendizaje automático (redes neuronales, maquinas de vectores de soporte, Deep learning, selvas aleatorias y modelos gráficos probabilísticos). Capacidades técnicas (conocimientos avanzados de al menos una al- ternativa por categoría): Lenguajes de programación (R, Python, Scala). Herramientas estadísticas (SAS, SPSS, Stata, Matlab). Computación distribuida (Spark, Map Reduce). Aprendizaje automático (Spark MLlib, Mahout, Weka, librerias R/Python). Bases de datos relacionales (MySQL, PostgreSQL, Oracle, SQL Server). Bases de datos NoSQL (Cassandra, MongoDB, HBase). Visualización (QlikView, QlikSense, Tableau, Spotfire, D3.js). 2. INGENIERÍA DE DATOS / DATA MANAGEMENT (INGENIERÍA DEL DATO) Estas formaciones vienen derivadas del tradicional Computer Science . Se comienza con los conceptos fundacionales de la informática para centrarse posteriormente en el ámbito del Big Data: sistemas distribuidos, herramien- tas de gestión, lenguajes de programación, etc. En la formación de estos ingenieros no se hace tanto hincapié en cubrir los ámbitos de analítica avanzada y de negocio, especialmente sobre este último. Sí se les dota de los conocimientos básicos para que puedan enten- der las necesidades analíticas y de negocio, y alinearlas a la estrategia de soluciones de Big Data. Los principales conocimientos que se han de adquirir por tipología: Capacidades técnicas (conocimientos avanzados en una o más alternati- vas de cada categoría): - Lenguajes de programación (Scala, Java, Python, R). - Herramientas estadísticas (SAS, SPSS, Stata, Matlab). - Computación distribuida (Spark, Map Reduce, Storm). - Aprendizaje automático (Spark MLlib, Mahout, Weka). - Bases de datos relacionales (MySQL, PostgreSQL, Oracle, SQL Server). - Bases de datos NoSQL (Cassandra, MongoDB, HBase). - Nube (AWS, Azure, Google Cloud). - Plataformas Big Data (Cloudera, Hortonworks). - Visualización (QlikView, QlikSense, Tableau, Spotfire, D3.js).
Made with FlippingBook - Online Brochure Maker