_04 | Inteligencia Artificial & Ciencia de Datos
Bloque 1. Arquitectura y procesamiento de datos a gran escala _06
_01 Fundamentos de Big Data e Inteligencia Artificial
_02 Introducción al tratamiento y análisis de Datos con Python
_03 Diseño y explotación de bases de datos relacionales
_04 Arquitecturas de datos relacionales modernas con PostgreSQL
_05 Procesamiento distribuido con Apache Spark
Tecnologías de almacenamiento escablable
Nociones básicas del modelo relacional: modelo conceptual, modelo lógico y modelo físico. Introducción al lenguaje de consultas estructurado SQL: DDL, DML y DCL.
Fundamentos y PostgreSQL como plataforma moderna.
Introducción a Spark y conceptos básicos.
Introducción a las bases de datos NoSQL: origen, evolución y contexto histórico. Persistencia poliglota: escoger el modelo de datos más adecuado para cada problema.
§
§
§
§
Definición, componentes y tipología de sistemas de Inteligencia de Negocio. Contextualización y diseño de sistemas de Inteligencia de Negocio.
El lenguaje de programación Python.
§
§
§ Time Series y TigerData (TimeScaleDB).
Tipos de datos y funciones SQL.
§
Captación, fuentes de datos y formatos. Procesos ETL: archivos, bases de datos.
§
§
§
§
JSONB, Full-Text Search y Clave-Valor.
§
Operaciones avanzadas con DataFrames.
§
Acceso a datos Web.
§
Bases de datos vectoriales e IA.
§
Análisis de datos con SQL.
§ Modelos de agregación: características, tipos y consideraciones de diseño y casos de uso.
§
Fuentes y calidad de los datos.
§
Análisis avanzado y casos prácticos.
§
Servicios Web y APIs.
§
§ Arquitecturas completas y escalabilidad.
Optimización y proyecto final.
Modelos en grafo: características, consideraciones de diseño y casos de uso.
§
§
§ Sistemas distribuidos: definición, tipos, estrategias de distribucióny consistencia de datos (ACID vs BASE).
Ejercicios y ejemplos usando bases de datos NoSQL: MongoDB y Neo4J.
§
Made with FlippingBook flipbook maker