Guía sobre datos abiertos en el entorno empresarial

ESCENARIO 4 Organizaciones con datos consolidados extraídos de distintas fuentes

DB

DB

DB

Extract

Transform

Publish

ODS

ODS Staging

Open Data

OLTP

.xls

Descripción : En este escenario se asume que la organización dispone de la ex- periencia y herramientas de ETC(ETL) necesarias. Todas las técnicas de extrac- ción y transformación que se aplican para el datawarehouse o Business Intelli- gence son válidas para los procesos de ETCD o ETDA. En un proceso de ETC(ETL) los datos de origen se extraen de distintas fuentes y se almacenan de manera consistente en un el ODS – Operational Data Store -. Los datos están además disponibles al más bajo nivel de granularidad. Los da- tos del ODS se procesan en distintas fases que requieren almacenar los datos en tablas intermedias. Posteriormente se agregan los datos y se refinan hasta que sean consistentes antes de guardarlos en el datawarehouse. En el caso de da- tos compartidos o datos a publicar en abierto, los pasos y tablas intermedias de transformación pueden ser otros. Procesos ETCD o ETDA no es necesario extraer los datos de manera separada, podemos partir directamente del ODS. En el proceso de transformación, los flu- jos de datos pueden provenir de los procesos de ETC. En algunos casos se nece- sitará modificar alguna fase del ETL o sustituir una fase por otra. Se recomienda reutilizar la mayor parte del proceso ETC. No es necesario ninguna herramienta adicional para estos procesos.

Para la publicación de los datos en abierto, éstos deben de someterse al proceso de publicación de la organización, al igual que en el escenario 1.

81

Anexo I: Escenarios del proceso ETCD

Made with FlippingBook - Online Brochure Maker