Extraer, Transformar y Compartir datos (ETCD) . Consiste en definir las es- pecificaciones técnicas para implantar un sistema/plataforma que permita el flujo de datos y la transformación de datos a llevar a cabo en la organiza- ción para que estos datos estén listos para compartir o abrir. El proceso de ETCD con la tecnología implementada es el proceso central que se ejecuta- rá de manera recurrente para la obtención de los datasets de uso interno o para compartir/abrir a terceros. Canales de compartición de datos . Son los distintos mecanismos técnicos habilitados para la distribución de los datos de la organización a terceros 4 : Web, API, Portal de Datos, Marketplace, Plataforma Industrial o Facilitado- res técnicos. Una organización puede distribuir datos a través de más de un canal, variar los canales de distribución en el tiempo según el propósito de la compartición/apertura de datos, etc. Búsqueda de datos . Existen mecanismos de búsqueda BÁSICOS (ej. CMS), AVANZADOS (usando SPARQL) o buscadores universales específicos de datasets (ej. https:/toolbox.google.com/datasearch). Dependiendo de la estrategia de compartición/apertura de datos convendrá utilizar unos u otros. Otros aspectos técnicos que considerar en una iniciativa de compartición/ apertura: ¿dónde almacenar los datos?; ¿dónde compartirlos?; ¿quién admi- nistrará los canales de distribución?; ¿qué servicio ofrecerá la organización?, etc. d) Poner en práctica el ciclo de vida de los datos: recoger, preparar, com- partir o publicar y mantener . Describe los pasos a seguir para la generación de cada dataset a compartir/publicar. Se abordan los aspectos relevantes del o : cali- dad del dato, preparación legal, gestión de datos sensibles, etc. Recogida de datos . Para las organizaciones sin experiencia en la comparti- ción/apertura de datos se recomienda seguir un proceso para la identifica- ción y priorización de los datos a compartir/publicar. 1. Preparación de datos . Preparación legal del dato para la compartición/ apertura. Este aspecto es clave para la compartición/publicación. Si el dato no cumple con la normativa vigente, y tiene las licencias adecuadas, no se puede compartir. 2. Calidad del dato : - Contenido: ¿El dato está completo?; ¿Están los datos limpios?; ¿Son los datos suficientemente precisos para el propósito en cuestión? Se sugie- re verificar campos vacíos, valores erróneos, dobles entradas, informa- ción privada sensible; etc. - Prontitud: ¿con qué frecuencia se actualizan?; ¿Son datos en tiempo real? - Consistencia en la presentación de datos para facilitar su reutilización por terceros. - La calidad del dato se puede medir por su nivel de cumplimiento de los principios FAIR ( Findable, Accessible, Interoperable, Reusable) al in- cluir los metadatos adecuados y los identificadores persistentes para su identificación y reutilización.
4 https://eur-lex.europa.eu/legal- content/EN/TXT/PDF/?uri=CELEX: 52018SC0125&rid=2
25
Introducción
Made with FlippingBook - Online Brochure Maker