Guía sobre datos abiertos en el entorno empresarial

5. Publicar las categorías de datos y los datasets disponibles por categoría : La clasificación de los datasets en categorías se puede hacer de manera au- tomática a través de los metadatos asociados a los datasets . Por ejemplo en el portal de datos europeos, la categorización de los datasets 24 se realiza de manera automática basándose en el estándar DCAT a través de la extracción de metadatos ( metadata harvesting) .

4.4.2 Preparar datos

El propósito es preparar los datos (cada dataset ) para compartirlos o publicarlos en abierto. Los datos de partida identificados, la mayoría de las veces, hay que tratarlos antes de su publicación.

El tratamiento o preparación de los datos abarca los siguientes aspectos (a eje- cutar no necesariamente de manera secuencial):

 Calidad del dato.

 Preparación del dato.

 Añadiendo metadatos.

 Preparación legal.

 Gestión de datos sensibles.

La viabilidad legal de la apertura/compartición del dato es clave para poner en marcha el proceso de preparación del dataset . Es decir, si los datos no cumplen con la legislación vigente, no se pueden compartir/abrir por lo que no tiene sen- tido iniciar el proceso de preparación.

24 http://www.europeandataportal.eu

1. Calidad del dato : La calidad del dato abarca aspectos como:

 Contenido : La utilidad del dato está condicionada por su calidad. Principa- les aspectos que determinan la calidad del dato y qué hacer para mejorarlos:

 ¿Es el dato completo?Describir una cabecera con una descripción única en los metadatos. No cambiar la estructura, aunque cambien los datos; tiene que tener un número de versión y, si el contenido cambia, se debe asignar una nueva versión para facilitar la traza de los cambios; describir el contenido de la información: sobre qué es el dato, de donde procede y con qué propósito se quiere compartir o publicar; asignarle un estado (ej. borrador/validado/final).  ¿Están los datos limpios? Verificar campos vacíos; ¿tienen sentido los va- lores por defecto y los datos ficticios?; valores erróneos; dobles entradas; información privada sensible; ¿se viola algún requisito legal?  ¿Son los datos precisos? ¿Es el dato suficientemente preciso para el pro- pósito concreto (compartición de datos) o potencial (datos abiertos) ?; ¿Afecta la precisión a su fiabilidad? ¿Se han descrito la elección de los in- tervalos de tiempo? ¿Necesitan los datos pasar por un proceso de agre- gación o desagregación?

50

Fundamentos técnicos de la apertura/compartición de datos en el entorno empresarial

Made with FlippingBook - Online Brochure Maker