5. Publicar las categorías de datos y los datasets disponibles por categoría : La clasificación de los datasets en categorías se puede hacer de manera au- tomática a través de los metadatos asociados a los datasets . Por ejemplo en el portal de datos europeos, la categorización de los datasets 24 se realiza de manera automática basándose en el estándar DCAT a través de la extracción de metadatos ( metadata harvesting) .
4.4.2 Preparar datos
El propósito es preparar los datos (cada dataset ) para compartirlos o publicarlos en abierto. Los datos de partida identificados, la mayoría de las veces, hay que tratarlos antes de su publicación.
El tratamiento o preparación de los datos abarca los siguientes aspectos (a eje- cutar no necesariamente de manera secuencial):
Calidad del dato.
Preparación del dato.
Añadiendo metadatos.
Preparación legal.
Gestión de datos sensibles.
La viabilidad legal de la apertura/compartición del dato es clave para poner en marcha el proceso de preparación del dataset . Es decir, si los datos no cumplen con la legislación vigente, no se pueden compartir/abrir por lo que no tiene sen- tido iniciar el proceso de preparación.
24 http://www.europeandataportal.eu
1. Calidad del dato : La calidad del dato abarca aspectos como:
Contenido : La utilidad del dato está condicionada por su calidad. Principa- les aspectos que determinan la calidad del dato y qué hacer para mejorarlos:
¿Es el dato completo?Describir una cabecera con una descripción única en los metadatos. No cambiar la estructura, aunque cambien los datos; tiene que tener un número de versión y, si el contenido cambia, se debe asignar una nueva versión para facilitar la traza de los cambios; describir el contenido de la información: sobre qué es el dato, de donde procede y con qué propósito se quiere compartir o publicar; asignarle un estado (ej. borrador/validado/final). ¿Están los datos limpios? Verificar campos vacíos; ¿tienen sentido los va- lores por defecto y los datos ficticios?; valores erróneos; dobles entradas; información privada sensible; ¿se viola algún requisito legal? ¿Son los datos precisos? ¿Es el dato suficientemente preciso para el pro- pósito concreto (compartición de datos) o potencial (datos abiertos) ?; ¿Afecta la precisión a su fiabilidad? ¿Se han descrito la elección de los in- tervalos de tiempo? ¿Necesitan los datos pasar por un proceso de agre- gación o desagregación?
50
Fundamentos técnicos de la apertura/compartición de datos en el entorno empresarial
Made with FlippingBook - Online Brochure Maker