Folleto Master en Inteligencia Artificial & Data Management

Inteligencia Artificial & Data Management

5

Contenidos

en las que podemos encontrar esos datos, cómo seleccionar los que nos son útiles utilizando lenguajes de consulta, fuentes de datos y conceptos como la inteligencia de fuente abierta. Por último, se estudiarán alternativas a la hora de integrar diferentes fuentes de información (web, APIs y crawlers). • Tecnologías para recoger información. • Estructuras en las que se encuentran los datos. • Integración de fuentes de información: servicios web, APIs y crawlers. • Transformación y limpieza de datos. Herramientas ETL. • Redes sociales.

• Base de datos: NoSQL, Apache Cassandra, MongoDB, Neo4j. • Procesamiento batch: Ecosistemas - Hadoop. • Componentes Hadoop - HDFS, MapReduce y Yarn, Hive, Spark, Pig, HBASE, Impala, Flume, Sqoop, Ozie, Clusters. • Apache Spark. • Componentes Apache Spark: Spark Streaming, Spark SQL,MLlib, SparkR. • Procesamiento en streaming. • Bases de datos analíticas. • Elastyc Search.

NIVELACIÓN

Este módulo tiene por objetivo familiarizase con el uso de herramientas que se verán a lo largo programa: conceptos básicos de IT, desarrollo, SO, etc.

INTRODUCCIÓN

FUENTES DE DATOS Y CAPTACIÓN DE INFORMACIÓN Se revisarán las distintas tecnologías utilizadas para recoger información. Asimismo, se estudiarán las estructuras En este módulo se adquirirán los conceptos básicos para poder acometer la formación del máster con éxito y conseguir una visión global y teórica sobre el universo big data. • Introducción al ecosistema big data. • Explotación del dato. • Gestión estratégica basada en datos.

ALMACENAMIENTO Y PROCESAMIENTO

Una vez conocidos los métodos para recoger los datos, en este módulo se estudian las distintas formas de almacenar y manejar los datos captados, como las bases de datos NoSQL. También se analizan distintos ecosistemas y sus componentes.

Made with FlippingBook flipbook maker