Guía sobre datos abiertos en el entorno empresarial

Datos compartidos/abiertos: Revisar los procesos existentes para asegurarse que cumplen todos los requisitos legales para poder compartir con terceros o publicarlos como datos abiertos. Los segundosmás restrictivos que los primeros. Transformar Aplicar el proceso de preparación para transformar los datos publicados en da- tos listos para compartir/abrir o linked data .

Para la publicación de los datos en abierto, éstos deben de someterse al proceso de publicación de la organización, al igual que en el escenario 1.

ESCENARIO 3 Los datos a publicar/compartir están en base de datos

OPEN DATA PROCESS

Internal DB

Open Data

Extract

Transform

Publish

The ETP-Process starting from an existing database

Descripción : Extraer datos de una Base de Datos y transformarla en un flujo de datos a compartir con terceros o publicar en abierto. Este escenario es distinto de los anteriores y asume que la base de datos es estándar (ej. Oracle, SQL ser- ver) y la organización es propietaria de esta o, en cualquier caso, puede aplicar las técnicas de extracción y transformación, sin ningún impedimento por parte de terceros, a las tablas gestionadas por la base de datos.

Este es un caso típico que requiere aplicar técnicas de extracción y transforma- ción.

¿Por qué es necesario extraer datos a un fichero? Porque los datos de la base de datos (datos en origen) están estructurados para que resulte óptimo su acceso para las aplicaciones operativas de la organización y no para ser compartidos por terceros o publicarlos como datos abiertos. Esta estructura se llama OLTP (on-li- ne transaction processing) y es de naturaleza relacional (los datos están ligados a través de relaciones (claves) que permiten relacionar los datos entre distintas tablas. Si los datos están en bases de datos distintas, es preferible crear un mapa lógico de datos ( dataset destino) que se abstraiga de las relaciones físicas existentes en las bases de datos de origen y aplicar las transformaciones oportunas (ej. sus- tituir identificadores por valores, hacer que las referencias sean consistentes – 0 = hombre; 1=Mujer -, etc.) hasta obtener el dataset correspondiente al mapa ló- gico de datos. En cualquier caso, muy raramente se pueden compartir o abrir los datos tal cual están en la base de datos de partida.

Si además los datos están en distintos formatos fuente (ej. bases de datos, fiche- ros planos, etc.), el escenario sería el siguiente (escenario 4).

79

Anexo I: Escenarios del proceso ETCD

Made with FlippingBook - Online Brochure Maker