Big Data & Business Analytics
5
Contenidos
en las que podemos encontrar esos datos, cómo seleccionar los que nos son útiles utilizando lenguajes de consulta, fuentes de datos y conceptos como la inteligencia de fuente abierta. Por último, se estudiarán alternativas a la hora de integrar diferentes fuentes de información (web, APIs y crawlers). • Tecnologías para recoger información. • Estructuras en las que se encuentran los datos. • Integración de fuentes de información: servicios web, APIs y crawlers. • Transformación y limpieza de datos. Herramientas ETL. • Redes sociales.
• Base de datos: NoSQL, Apache Cassandra, MongoDB, Neo4j. • Procesamiento batch: Ecosistemas - Hadoop. • Componentes Hadoop - HDFS, MapReduce y Yarn, Hive, Spark, Pig, HBASE, Impala, Flume, Sqoop, Ozie, Clusters. • Apache Spark. • Componentes Apache Spark: Spark Streaming, Spark SQL,MLlib, SparkR. • Procesamiento en streaming. • Bases de datos analíticas. • Elastyc Search.
NIVELACIÓN
Este módulo tiene por objetivo familiarizase con el uso de herramientas que se verán a lo largo programa: conceptos básicos de IT, desarrollo, SO, etc.
INTRODUCCIÓN
En este módulo se adquirirán los conceptos básicos para poder acometer la formación del máster con éxito y conseguir una visión global y teórica sobre el universo big data. • Introducción al ecosistema big data. • Explotación del dato. • Gestión estratégica basada en datos.
ALMACENAMIENTO Y PROCESAMIENTO
Una vez conocidos los métodos para recoger los datos, en este módulo se estudian las distintas formas de almacenar y manejar los datos captados, como las bases de datos NoSQL. También se analizan distintos ecosistemas y sus componentes.
FUENTES DE DATOS Y CAPTACIÓN DE INFORMACIÓN Se revisarán las distintas tecnologías utilizadas para recoger información. Asimismo, se estudiarán las estructuras
Made with FlippingBook - professional solution for displaying marketing and sales documents online