Guía sobre datos abiertos en el entorno empresarial

Extraer

La mayoría de los sistemas de bases de datos (ej. ORACLE, SQL Server) dispo- nen de técnicas estándar para leer de tablas y escribir en ficheros planos. Por ejemplo:

 Oracle: vía EXPORT tool.

 Microsfot SQL Server: via mysqldump tool.

 ProgressSQL: vía SQL Dump procedure.

Sin embargo, cuando los datos de partida cambian con frecuencia, una buena alternativa es escribir programas que lean los datos directamente del Sistema de gestión de datos (DBMS) víaODBC – JDBC. ODBC (o SQL directo) permite pro- gramar extracciones más complejas.

Finalmente, existe también la posibilidad de utilizar herramientas de ETC(ETL).

Desde un punto de vista práctico, en caso de que sea necesario hacer transfor- maciones complejas, es recomendable almacenar los datos en una base de da- tos intermedia, temporal o permanente, de la que se obtendrá el flujo de datos final (a compartir o publicar en abierto). En este caso, hay que tener en cuenta las dos dimensiones del flujo de datos:

 Exportar todo el contenido de la base de datos para que sea compartido o publicado en abierto.

 Descargar lasmodificaciones/delta con respecto a la versión previa y combi- narlas con el flujo de datos.

Transformar

En esta fase se abordan, como en el caso del entorno del datawarehouse, la revi- sión de la calidad de los datos. Por ejemplo, utilizar los mismos nombres de cam- pos para los mismos datos, transformar las abreviaturas en nombres completos, guardar los datos de manera consistente, etc. Los procesos de anonimización, agrupación de datos para conseguir el mismo nivel de granularidad, etc. se rea- lizan en este paso.

Recomendación: en caso de que los datos cambien con mucha rapidez, es preferible poner los datos a disposición de terceros lo antes posible en lugar de perder tiempo en transformaciones que no son estrictamente necesarios para el propósito en cuestión.

Para la publicación de los datos en abierto, éstos deben de someterse al proceso de publicación de la organización, al igual que en el escenario 1.

80

Anexo I: Escenarios del proceso ETCD

Made with FlippingBook - Online Brochure Maker