Guía de recomendaciones y buenas prácticas para la apertura y compartición de datos en el entorno empresarial, elaborada por el Grupo de Trabajo de Cotec en Datos Abiertos.
GUÍA PARA LA APERTURA Y COMPARTICIÓN DE DATOS EN EL ENTORNO EMPRESARIAL
fundamentos, recomendaciones y buenas prácticas
ÍNDICE
CÓMO UTILIZAR ESTA GUÍA ............................................................................................................................................................. 5 1. EXPERIMENTACIÓN Y CONCIENCIACIÓN .................................................................................................. 7 Poniendo en marcha una 1ª experiencia en compartición o apertura de datos .......................................................................................................................... 8 2. CÓMO DEFINIR UNA BUENA ESTRATEGIA DE DATOS ABIERTOS O COMPARTIDOS ....................................................................................................... 10 3. CÓMOORIENTAR LA EMPRESA HACIA LA COMPARTICIÓN O APERTURA DE DATOS: PREPARACIÓN TÉCNICA ..................................................................... 13 4. PONIENDO EN PRÁCTICA EL CICLO DE VIDA DE LOS DATOS: RECOGER, PREPARAR, PUBLICAR Y MANTENER ......................... 15 5. ¿CUÁL ES EL NIVEL DE ÉXITO? MONITORIZACIÓN DE LA INICIATIVA .............................................................................................................. 17
1. INTRODUCCIÓN ..................................................................................................................................................................................... 20 1.1 ¿Por qué debería compartir o abrir los datos de mi empresa? ................................................ 20 1.2 ¿Cuál es la diferencia entre la compartición y la apertura de datos? ................................. 21 1.3 ¿Por dónde empezar? ............................................................................................................................................................ 22 1.4 ¿Qué contiene esta guía y a quién está dirigida? .................................................................................. 23 1.5 Aspectos relevantes de la apertura/compartición de datos ..................................................... 26 1.6 ¿Quién ha realizado esta guía? ................................................................................................................................... 26
2. LA APERTURA Y COMPARTICIÓN DE DATOS EN EL ÁMBITO EMPRESARIAL ........................................................................................................................................... 28
3. ¿QUÉ PUEDE HACER UNA EMPRESA CON SUS DATOS? ............................................................. 30
4. FUNDAMENTOS TÉCNICOS DE LA APERTURA/COMPARTICIÓN DE DATOS EN EL ENTORNO EMPRESARIAL ................................................................................................... 32 4.1 Experimentación y concienciación ........................................................................................................................ 33 4.2 Definir una buena estrategia de datos abiertos o compartidos ............................................. 36 4.3 Preparación técnica: ................................................................................................................................................................ 39 4.3.1 Gestión de Datos .......................................................................................................................................................... 40 4.3.2 Extraer, Transformar y Compartir Datos (ETCD) ...................................................................... 42 4.3.3 Canales de Compartición de datos ......................................................................................................... 43 4.3.4 Búsqueda de Datos .................................................................................................................................................... 47 4.3.5 Otros aspectos técnicos ........................................................................................................................................ 47 4.4 Poner en práctica el ciclo de vida de los datos: recoger, preparar, publicar y mantener .............................................................................................................. 48 4.4.1 Recoger datos ................................................................................................................................................................ 48 4.4.2 Preparar datos ............................................................................................................................................................... 50 4.4.3 Publicar datos ................................................................................................................................................................. 53 4.4.4 Mantener datos, metadatos persistentes ........................................................................................ 54 4.5 Monitorización de la iniciativa, análisis del nivel de éxito y mejora continua .......... 54
Índice
5. ASPECTOS RELEVANTES DE LA APERTURA/COMPARTICIÓN DE DATOS EN EL ENTORNO EMPRESARIAL .................................................................................................. 56 5.1 Modelos de Relación .............................................................................................................................................................. 56 5.1.1 B2B (Business to Business) .............................................................................................................................. 56 5.1.2 B2G (Business to Government) ................................................................................................................ 60 5.2 Modelos de Financiación ................................................................................................................................................. 60 5.3 Marco Legal ...................................................................................................................................................................................... 64 5.3.1 Acuerdos Contractuales en el modelo de relación B2B ................................................ 64 5.3.2 Acuerdos contractuales en el modelo de relación B2G ................................................. 66 5.3.3 Licencias para la Compartición/Apertura de Datos ........................................................... 68 5.4 Roles, habilidades, desarrollo y gestión del conocimiento ............................................................ 71 5.4.1 Roles ............................................................................................................................................................................................ 71 5.4.2 Habilidades ......................................................................................................................................................................... 72 5.4.3 Desarrollo del conocimiento .......................................................................................................................... 72 5.4.4 Gestión del conocimiento ................................................................................................................................. 73 6. GLOSARIO EXPLICATIVO DE TÉRMINOS Y SIGLAS ............................................................................. 74 REFERENCIAS Y BIBLIOGRAFÍA ............................................................................................................................................. 76 ANEXO I: ESCENARIOS DEL PROCESO ETCD (EXTRACCIÓN Y TRANSFORMACIÓN) ........................................................................................................................... 78 ANEXO II: PRINCIPIOS QUE GUÍAN LOS MODELOS DE RELACIÓN .................................. 82 ANEXO III: LEGISLACIÓN APLICABLE ........................................................................................................................... 83 ANEXO IV: DESCRIPCIÓN DE ALGUNOS CONCEPTOS TÉCNICOS CLAVE EN EL ÁMBITO DE OPEN DATA ............................................................................................................................. 91 ANEXO V: SELECCIÓN NO EXHAUSTIVA DE HERRAMIENTAS Y APLICACIONES DE SOFTWARE LIBRE PARA LA IMPLEMENTACIÓN DE OPEN DATA .................................................................................................................................................................................................. 96 ANEXO VI:CUESTIONARIO SOBRE INICIATIVAS DE DATOS ABIERTOS EN EL SECTOR PRIVADO .................................................................................................................................................................... 98 ANEXO VII: DESCRIPCIÓN DE CASOS DE APERTURA Y COMPARTICIÓN DE DATOS .................................................................................................................................................... 107 PRIMAFRIO ...................................................................................................................................................................................................... 107 GRUPO EUSKALTEL ............................................................................................................................................................................ 109 TELEFÓNICA ..................................................................................................................................................................................................... 111 SUEZ .......................................................................................................................................................................................................................... 113 ITI .................................................................................................................................................................................................................................... 115 EDP ............................................................................................................................................................................................................................... 117 ARCELORMITTAL .................................................................................................................................................................................... 119
Índice
ÍNDICE DE TABLAS Tabla 1
ArcelorMittal: Ejemplo Datatón ................................................................................................................. 34 SUEZ: Ejemplo Datatón ...................................................................................................................................... 35 5 estrella de TimBernes Lee .......................................................................................................................... 53 BBVA VALORA: Ejemplo Datos Abiertos/Compartidos ................................................ 56 PRIMAFRIO: Ejemplo Datos Abiertos/Compartidos ........................................................ 57 EUSKALTEL: Ejemplo Monetización ................................................................................................... 58 ITI: Ejemplo Compartición de Datos Sectorial (Financiación Europea - H2020) ............................................................................................................. 59 Licencias para compartir/abrir datos ................................................................................................... 69 Disposiciones para Licencias ......................................................................................................................... 70 Principios Modelo de Negocio B2B ...................................................................................................... 82 Principios Modelo de Negocio B2G ..................................................................................................... 82 Aplicación del Reglamento ............................................................................................................................. 84 Principios del Reglamento ............................................................................................................................... 84 Fundamentos Jurídicos para el Tratamiento de Datos .................................................... 85 Obligaciones .................................................................................................................................................................... 86 Solicitudes de los Ciudadanos ...................................................................................................................... 87 Cumplimiento y Sanciones .............................................................................................................................. 88
Tabla 2
Tabla 3
Tabla 4
Tabla 5
Tabla 6
Tabla 7
Tabla 8
Tabla 9
Tabla 10
Tabla 11
Tabla 12
Tabla 13
Tabla 14
Tabla 15
Tabla 16
Tabla 17
ÍNDICE DE ILUSTRACIONES Ilustración 1 Fundamentos Apertura/Compartición de Datos
en Entorno Empresarial ........................................................................................................................................ 32
Ilustración 2 Preparación previa a la puesta en marcha del ciclo
de vida de datos abiertos/compartidos ............................................................................................. 40 Ilustración 3 Estructura Descentralizada ............................................................................................................................. 40 Ilustración 4 Estructura Centralizada ........................................................................................................................................ 41 Ilustración 5 Estructura Completamente Centralizada ...................................................................................... 42 Ilustración 6 Proceso ETCD o ETDA .......................................................................................................................................... 42 Ilustración 7 Canales de Compartición de Datos ....................................................................................................... 43 Ilustración 8 Ciclo de Vida de Apertura/Compartición de Datos ............................................................ 48 Ilustración 9 Actividades de Recolección ........................................................................................................................... 49
Índice
CÓMOUTILIZAR ESTA GUÍA
La Guía para la apertura y compartición de datos en el entorno empresarial tie ne un doble objetivo: por un lado, acercar a las empresas las oportunidades que supone la apertura o compartición de los datos que tiene en su poder, y por otro, acompañar a las organizaciones que quieran iniciar un proceso de este tipo. La guía incluye los diferentes apartados o pasos a seguir en una iniciativa de com- partición/apertura de datos:
1. EXPERIMENTACIÓN Y CONCIENCIACIÓN .......................................................................................................... 7
Poniendo en marcha una 1ª experiencia en compartición o apertura de datos ................................................................................................................................... 8
2. CÓMO DEFINIR UNA BUENA ESTRATEGIA DE DATOS ABIERTOS O COMPARTIDOS ............................................................................................................... 10
3. CÓMOORIENTAR LA EMPRESA HACIA LA COMPARTICIÓN O APERTURA DE DATOS: PREPARACIÓN TÉCNICA ............................................................................. 13
4. PONIENDO EN PRÁCTICA EL CICLO DE VIDA DE LOS DATOS: RECOGER, PREPARAR, PUBLICAR Y MANTENER ................................. 15
5. ¿CUÁL ES EL NIVEL DE ÉXITO? MONITORIZACIÓN DE LA INICIATIVA ...................................................................................................................... 17
Las siguientes páginas hacen un recorrido por cada una de estas fases. En cada una de ellas se indican los pasos que se han de seguir y qué decisiones tomar, di- rigiendo a los apartados específicos de la guía, donde se abarcan en profundidad cada una de esas cuestiones.
6
Cómo utilizar esta guía
1. EXPERIMENTACIÓN Y CONCIENCIACIÓN
Objetivo de esta fase
Identificar el potencial de los datos de la empresa.
Situación de partida de la empresa
Es el paso previo a iniciar un proyecto de compartición o apertura de datos. Esta fase está enfocada a aquellas compañías que no conocen el potencial de la información que manejan y quieren identificarlo.
Si la empresa dispone de conocimiento interno experto en analítica de datos
La empresa debe involucrar a ese personal para realizar un análisis de los datos existentes e identificar su potencial.Una vez identificado el potencial de los datos, el siguiente paso es la Definición de la Estrategia .
Si la empresa no dispone de conocimiento interno experto en analítica de datos
Lo más adecuado es buscar apoyo en personal técnico externo que pueda asesorar a la empresa en cuanto al valor y potencial de sus datos.
En la guía se incluyen diferentes tipos de apoyo:
• Facilitadores tecnológicos : Bajo un formato de colaboración, la empresa ofrece una parte de sus datos para que un centro tecnológico, universidad o consultora especializada los analice y extraiga conclusiones sobre su potencial. • Datatón : Concurso donde la empresa pone a disposición una parte de sus datos a equipos de participantes con perfiles expertos. Durante un tiempo determinado, los equipos experimentan con los datos para extraer su valor.
• Marketplace / Plataforma Industrial : Entornos online de confianza donde las empresas comparten sus datos con otras compañías y agentes reutilizadores de datos.
Ir a Poniendo en marcha una 1ª experiencia en compartición o apertura de datos.
Apartado Experimentación y Concienciación: pág. 33
Más información: Marketplaces y Plataformas Industriales en Canales de compartición de datos , pág. 43. Modelos de relación o negocio para el intercambio de datos, pág. 56.
Siguiente fase
Cómo definir una buena estrategia de datos abiertos o compartidos
Paso previo opcional
Poniendo en marcha una 1ª experiencia en compartición o apertura de datos
7
Cómo utilizar esta guía
Poniendo en marcha una 1ª experiencia en compartición o apertura de datos
Si la organización no tiene experiencia previa en procesos de compartición o apertura de datos, es una buena opción empezar mediante un proceso de experimentación que permita conocer el valor de los datos. Un proyecto de este tipo servirá también para entender en qué consiste un proceso de compartición o apertura de datos, de cara a impulsar en el futuro una iniciativa de este tipo. En la primera fase se han indicado varias modalidades para iniciarse en el ámbito de la compartición o apertura de datos si la organización no tiene experiencia previa. Es importante tener en cuenta que en los casos de Datatón y Marketplace, implican la compartición o apertura de datos con terceros. Si bien existen otros modelos, nos centraremos en estas dos fórmulas.
1. Definición de los objetivos y plan de acción
• Establecer el objetivo a conseguir mediante esta primera experiencia. En el caso del datatón, puede ser la búsqueda a una solución a un reto concreto de la empresa. En el caso del marketplace, el objetivo puede ser comprobar el valor de los datos para un futuro proceso que implique su monetización, entre otros.
• Establecer qué conjunto de datos se van a compartir o abrir.
• Decidir bajo qué modelo de relación se va a realizar la iniciativa. Siendo una primera experiencia, este itinerario se centra en las modalidades de Datatón oMarkeplace.
• Búsqueda de apoyo experto : es importante contar con un conocimiento experto a nivel tecnológico que acompañe a la organización en el proceso.
• Datatón : la iniciativa puede llevarse a cabo de la mano de un agente colaborador o facilitador tecnológico como un centro tecnológico, una universidad o una consultora especializada. Ejemplos de datatones: ArcelorMittal y Suez, págs. 33 y 34. • Marketplace : la propia plataforma puede contar con servicios que asesoran a las organizaciones sin experiencia previa en los procesos de compartición o apertura de datos.
• Asesoría jurídica : es fundamental contar con un asesoramiento en cuestiones legales para garantizar que los datos que se pondrán a disposición de terceros cumplen con la legislación en vigor.
Más información: Modelos de relación , pág. 18 Marco legal para los diferentes modelos de relación, pág. 64 Ejemplos de casos de apertura y compartición de datos , pág. 107 Legislación aplicable a la apertura o compartición de los datos, pág. 83
8
Cómo utilizar esta guía
2. Preparación organizativa y técnica
Esta fase incluye los aspectos relacionados con la gestión de los datos y la infraestructura tecnológica. Si bien en esta primera experimentación no se requiere aún iniciar un plan de acción completo, si es conveniente tener en cuenta algunos aspectos relacionados con los procesos de gestión, preparación y transformación de los datos. Esta información será útil para entender qué cambios organizativos y de infraestructura tecnológica son necesarios en el caso de llevar a cabo una futura iniciativa de compartición o apertura de datos completa.
Aspectos a tener en cuenta:
• Analizar en qué formatos están los datos que se van a compartir y si son utilizables por terceros.
• Establecer qué procesos de Extracción , Transformación y Compartició n deberían llevarse a cabo, con apoyo experto.
• Establecer qué procesos de recogida , preparación y publicació n deberían llevarse a cabo para obtener datasets de calidad que puedan ser reutilizados fácilmente por terceros, acompañados también por apoyo experto.
• Decidir bajo qué licencias se van a publicar los datos.
• Establecer medidas para monitorizar la iniciativa y poder obtener una valoración acerca de los resultados conseguidos.
Más información: Extraer, Transformar y Compartir datos, pág. 42 Puesta en marcha del ciclo de vida de los datos (proceso para generar datasets), pág. 48 Licencias , pág. 68 Monitorización de la iniciativa , pág. 54
3. Comunicación y concienciación
Tras esta primera iniciativa, es importante recoger los resultados de la experiencia, los beneficios y aprendizajes obtenidos, y comunicarlos al resto de la organización, en especial a los niveles directivos. Esto permitirá dar a conocer las oportunidades que ofrece la compartición y apertura de datos, pero también servirá para conocer las decisiones que deben ser tomadas a nivel estratégico, metodológico y tecnológico en un proceso de este tipo.
Siguiente fase
Cómo definir una buena estrategia de datos abiertos o compartidos
9
Cómo utilizar esta guía
2. CÓMO DEFINIR UNA BUENA ESTRATEGIA DE DATOS ABIERTOS O COMPARTIDOS
Objetivo de esta fase
Antes de empezar una iniciativa de compartición o apertura de datos, es importante tener una estrategia clara que defina los objetivos, la estrategia a seguir y las decisiones que deben tomarse a nivel organizativo.
Situación de partida de la empresa
La organización ya ha identificado el potencial de sus datos y quiere iniciar un proyecto de apertura o compartición de sus datos con terceros.
Pasos que incluye esta fase
1. Diagnóstico de partida
El primer paso consiste en tener una visión clara de la situación actual de la organización en relación a los datos. Para ello, es aconsejable identificar las personas clave que pueden ayudar a realizar este diagnóstico. Preguntas a realizar:
• ¿Qué unidades de la organización recogen, utilizan y/o producen datos?
•
¿Cómo se están gestionando estos datos?
• ¿Hay ya datos abiertos o compartidos? Si es así, ¿cómo se están publicando?
• •
¿Qué datos se quieren compartir?
• ¿Cuál es el flujo de datos actual en la organización?
2. Definición de los objetivos estratégicos
El siguiente paso consiste en establecer qué se quiere conseguir a través de la iniciativa de compartición o apertura de datos y en qué plazos. Para ello, existen varias decisiones a tomar:
• Clarificar el objetivo : generar una nueva línea de negocio, promover la innovación, resolver un problema, monetizar los datos...
• A partir del objetivo, decidir el Modelo de Relación (o negocio) bajo el cual compartiremos los datos. Puede ser bajo un modelo B2B ( Business to Business ) o B2G (Business to Government) y siguiendo diferentes modalidades (publicación en portal de datos abiertos, monetización, compartición en plataforma industrial sectorial...)
• Identificar el conocimiento interno para llevar a cabo la iniciativa. ¿Es necesario buscar apoyo especializado externo?
¿Es necesario buscar apoyo legal ?
•
• Definir medidas asociadas a los objetivos que permitan medir los resultados.
•
Cómo visualizar el flujo de datos destino.
10
Cómo utilizar esta guía
Información relacionada: Clarificar objetivo: ¿Por qué las compañías comparten/abren sus datos? , pág. 31 Modelos de relación , pág. 56
Marco legal para los diferentes modelos de relación, pág. 64 Principios que guían los Modelos de Relación , pág. 82 Roles, habilidades, desarrollo y gestión del conocimiento , pág. 71 Casos de apertura y compartición de datos , pág. 107
3. Definir el plan de acción e implantar la estrategia
Establecer el plan que permita alcanzar los objetivos marcados. Los aspectos principales de esta fase son:
• Asegurar la implicación de las personas involucradas en al iniciativa (internas o externas).
• Establecer medidas para asegurar la rentabilidad de la iniciativa, analizando el coste- beneficio.
• Definir cuál es el modelo de gestión de los datos que mejor encaja con los objetivos (Este aspecto se desarrolla en la fase Preparación Técnica).
• Analizar en qué formatos están los datos y si son utilizables por terceros. Identificar si hay datos sensibles.
Establecer qué licencias se van a utilizar.
•
• Definir y establecer los procesos ETPD e identificar la tecnología necesaria (este aspecto se desarrolla en la fase Preparación Técnica)
Información relacionada: Estructuras de Gestión de los Datos , pág. 40 Modelos de financiación y prácticas para cuantificar el valor de los datos, pág. 60 Licencias para la compartición o apertura de datos, pág. 68 Preparación Técnica previa a la puesta en marcha de la iniciativa de compartición de datos, pág. 39 Herramientas para Monitorizar la reutilización de los datos , pág. 54
4. Definir y mantener el inventario de datos
Enfocada a establecer los aspectos a tener en cuenta en relación a los datasets:
• Garantizar el cumplimiento de las normativas en relación a la protección de datos e identificar si hay datos sensibles .
• Cuantificar el valor económico de los datasets en base al modelo de financiación.
Información relacionada: Legislación aplicable a la apertura o compartición de datos, pág. 83 Gestión de los datos sensibles , pág. 52 Valoración de los datasets y cálculo de tarifas, pág. 61
11
Cómo utilizar esta guía
5. Definir la política de datos abiertos o compartidos y comunicarla
Definir una política a nivel organizacional y comunicarla es esencial porque aumenta la transparencia de la organización, contribuye a concienciar acerca de los beneficios de la apertura de datos y redunda en el éxito de la iniciativa.
Apartado Definición de la Estrategia : pág. 36
Siguiente fase
Cómo orientar la empresa hacia la apertura de datos – Preparación Técnica
12
Cómo utilizar esta guía
3. CÓMOORIENTAR LA EMPRESA HACIA LA COMPARTICIÓNOAPERTURA DE DATOS: PREPARACIÓN TÉCNICA
Objetivo de esta fase
En esta fase se toman las decisiones ligadas a la preparación técnica y la implementación del proceso de compartición o apertura de datos. Esto incluye los aspectos relacionados con la gestión de los datos y la infraestructura tecnológica que se va a utilizar.
Situación de partida
La organización ya ha identificado el potencial de los datos de su empresa y ha tomado las decisiones esenciales acerca de cómo se realizará el proyecto mediante la definición de la estrategia. Ya ha decidido cuál es el objetivo de la iniciativa y el modelo de relación a seguir, el equipo especializado, los datos que se van a compartir y el modelo de financiación del proyecto.
Decisiones técnicas a tomar en esta fase
1. Cómo va a ser la gestión de los datos
La organización debe decidir cuál debe ser la estructura de gestión o gobernanza de los datos. Si aún no existe, es muy aconsejable establecer una antes de iniciar la compartición o apertura de datos. A nivel teórico, pueden ser: Gestión de datos descentralizada : La administración de los datos se realiza por unidades o personas que tienen la responsabilidad de gestionar sus propios datos. •
•
Gestión de datos centralizada – federada : La gestión de los datos está distribuida, pero la responsabilidad está centralizada.
• Gestión de datos completamente centralizada : La estandarización se define en el nivel más alto, garantizando la consistencia a lo largo de toda la organización.
Cambiar hacia una estructura de gestión de los datos tiene un impacto importante en la organización, así que si no hay una experiencia previa, es aconsejable conseguir apoyo por parte de agentes expertos en gestión de los datos.
Más información: Gestión de los Datos, pág. 40
13
Cómo utilizar esta guía
2. Proceso ETCD (Extraer, Transformar y Compartir Datos)
El proceso ETCD consiste en las especificaciones técnicas de cómo los datos fluyen dentro de la organización, se transforman en datasets publicables y, eventualmente, se comparten. Es un proceso que debe definirse a nivel organizacional.
Consta de 3 pasos:
Extraer : Los datos se pueden extraer de cualquier tipo de fuente (interna o externa). El proceso de extracción dependerá de la estructura de gestión de los datos.
Transformar : Los datos deben transformarse en datasets listos para compartir. Es una fase que ha de estandarizarse mediante la definición de una guía de preparación de los datos.
Compartir : Esta fase no es necesaria si los datasets son para uso interno. Consiste en identificar los canales donde compartir o abrir los datos (siguiente apartado).
El proceso relacionado con la preparación específica de cada dataset, incluyendo los aspectos de calidad, inclusión de metadatos y aspectos legales, están recogidos en la fase Ciclo de vida de los datos , pág. 48
Para más información sobre el proceso ETCD, se puede consultar el Anexo I – Escenarios del proceso ETCD , pág. 78
3. Canales donde compartir los datos
Existen diferentes canales donde compartir o abrir los datos. La elección del canal dependerá del número de datasets a compartir y de las necesidades específicas de cada organización. Se recomienda empezar por las soluciones más sencillas. Los principales canales son:
•
Descargas víaWeb.
• API (Interfaz de Programación de Aplicaciones). • Portal de Datos (propio o de terceros). • Marketplace. • Plataforma Industrial. • Facilitador técnico.
Más información: Canales de compartición de datos , pág. 43
4. Búsqueda de Datos y otros aspectos técnicos
Es aconsejable implementar funcionalidades para facilitar la búsqueda de los datos. En función del canal escogido para compartirlos, se pueden utilizar mecanismos de mayor o menor complejidad.
También deben tomarse otras decisiones técnicas, relacionadas con la selección del dominio y el hosting y la administración del canal donde se comparten los datos.
Más información: Búsqueda de Datos y otros aspectos técnicos , pág. 47
Siguiente fase
Poniendo en práctica el ciclo de vida de los datos: recoger, preparar, publicar y mantener
14
Cómo utilizar esta guía
4. PONIENDO EN PRÁCTICA EL CICLO DE VIDA DE LOS DATOS: RECOGER, PREPARAR, PUBLICAR Y MANTENER
Objetivo de esta fase
Establecer los pasos concretos a seguir para, partiendo de los datos, generar cada uno de los datasets y que estén listos para ser compartidos o abiertos. Incluye los procesos de recoger los datos, prepararlos, publicarlos y mantenerlos.
Situación de partida de la empresa
La empresa ya ha establecido su estrategia para la apertura o compartición de sus datos y ha tomado las decisiones organizativas y técnicas en relación a:
• •
Cómo se van a gestionar los datos. Cómo se realizará el proceso ETCD.
• Qué canal se va a utilizar para compartir los datos.
Pasos que incluye esta fase:
1. Recogida de datos
Esta fase consiste en:
•
Mapear o identificar los datos disponibles.
• Priorizar aquellos que son más adecuados (porque encajan con el objetivo, porque tienen mayor calidad,...). • Categorizar los datasets y publicar las categorías.
Más información: Fase de Recogida de datos , pág. 48
2. Preparación de los datos
Una vez los datos han sido recolectados, deben ser preparados para su compartición o apertura, puesto que no pueden publicarse en bruto. Esta fase es clave, puesto que si los datos no cumplen con la legislación vigente, no se pueden compartir o abrir .
Hay varios aspectos a tener en cuenta:
• Determinar la calidad del dato : Si están completos, si están limpios y son precisos, si están actualizados y si siguen unos estándares establecidos.
• Prepararlos para su publicación : Los datos deben ser publicados bajo el método linked data , o datos enlazados, para permitir su interoperabilidad. Es esencial que lleven asociados metadatos , esto es, información estructurada que describe el dataset y permite que sea encontrado. • Preparación legal : Se debe comprobar que los datos respetan la legislación en vigor. Además, cada dataset debe tener asociada una licencia que establece sus condiciones de uso.
• Gestión de los datos sensibles : Si los datasets incluyen datos sensibles, necesitarán una preparación especial.
• Chequeo final para verificar la preparación de los datasets en todos los aspectos nombrados (calidad, interoperabilidad e inclusión de metadatos, licencias,...)
15
Cómo utilizar esta guía
Más información: Fase Preparar los datos , pág. 50
Información relacionada: Qué son los Metadatos , pág. 53 Métodos para determinar la calidad del dataset (MELODA 5, Estrellas de Tim Berners-Lee y FAIR), pág. 53 Preparación técnica para llevar a cabo el proceso de Extraer , Transformar y Compartir los datos, pág. 42 Licencias para la compartición o apertura de datos , pág. 68 Legislación aplicable a la apertura o compartición de datos, pág. 83 Proceso de Gestión de Datos Sensibles , pág. 52
3. Publicación de los datos
La publicación de datos se realiza en canales de compartición o publicación establecidos. La decisión acerca de qué canal elegir se recoge en la fase previa de Preparación Técnica .
Más información: Canales de compartición de datos , pág. 43
4. Mantener los datos y metadatos
Los datos y metadatos pueden cambiar con el tiempo y quedar obsoletos. Por ello, se recomienda definir un proceso de mantenimiento de los datos compartidos o abiertos. Algunos aspectos a tener en cuenta: • Realizar actualizaciones periódicas e incluir la fecha en los metadatos. • Comprobar que las URI y URL siguen activas. • Incluir un canal de contacto para que los agentes reutilizadores puedan dar feedback .
Más información: Mantener datos y metadatos , pág. 54
Apartado Puesta en práctica del ciclo de vida de los datos abiertos o compartidos , pág. 44
Siguiente fase
Midiendo el éxito: monitorización de la iniciativa de compartición o apertura de datos
16
Cómo utilizar esta guía
5. MIDIENDO EL ÉXITO: MONITORIZACIÓN DE LA INICIATIVA DE COMPARTICIÓNO APERTURA DE DATOS
Objetivo de esta fase
Realizar un seguimiento de la iniciativa en su totalidad para comprobar su nivel de éxito.
Situación de partida de la empresa
La empresa ya tiene en marcha un proyecto de compartición o apertura de datos y debe implementar un método para poder realizar un seguimiento.
Principales acciones a realizar para la monitorización de la iniciativa:
Contrastar el compromiso de las organizaciones y agentes reutilizadores
El compromiso de los agentes reutilizadores es esencial para el éxito de cualquier iniciativa de compartición o apertura de datos. El modelo 5 Estrellas de TimDavies es una herramienta útil para analizar el nivel de interacción que ofrecen los datos.
Medir el éxito de la iniciativa y el nivel de mejora continua
Existen varias medidas para evaluar el desempeño de la iniciativa:
• Contabilizar el número de descargas de los datasets
•
Contabilizar el número de accesos al dato.
• Utilizar métricas cualitativas para evaluar si los datasets son útiles.
PIWIK es una herramienta libre para analizar de forma cualitativa la preparación del dato en función de las necesidades de los agentes reutilizadores.
Información relacionada: Métodos para determinar la calidad del dataset , pág. 53 Mantener datos y metadatos , pág. 54
Apartado Monitorización de la iniciativa de compartición o apertura de datos , pág. 54
Aspectos relevantes en una iniciativa de compartición o apertura de datos
La guía incluye diferentes cuestiones clave a tener en cuenta durante el proceso de definición y posterior puesta en marcha de una iniciativa de compartición o apertura de datos. Los más relevantes son: • Modelos de relación o negocio para la compartición o apertura de los datos. • Modelos de financiación. • Marco legal y principios que guían los modelos de relación o negocio. • Licencias para la compartición o apertura de datos. • Roles, habilidades, desarrollo y gestión del conocimiento.
17
Cómo utilizar esta guía
Modelos de Relación (o negocio)
La organización puede compartir o abrir sus datos siguiendo diferentes modelos de relación o de negocio en función del objetivo estratégico de la iniciativa: apertura de nuevas líneas de negocio, monetización de los datos, búsqueda de nuevas colaboraciones, u otros.
Se establecen dos modelos, B2B ( Business to Business ) o B2G ( Business to Government ) y diferentes modalidades. Algunas de ellas son:
• Datos Abiertos/Compartidos : Los datos son puestos a disposición de un rango abierto de agentes reutilizadores. Ejemplos: BBVA Valora, pág. 56 Primafrio, pág. 107 • Monetización de datos (B2B o B2G): Enfoque unilateral en el que las empresas tienen ingresos adicionales gracias a los datos que comparten. Ejemplo: Euskaltel, pág. 109 • Plataforma Industrial (B2B): Los datos se comparten en un entorno cerrado y seguro, entre un grupo restringido de empresas. Ejemplo: ITI, pág. 115 • Facilitadores Tecnológicos (B2B): Habilitadores técnicos que actúan como tercera parte ofreciendo una solución para el intercambio de datos o un servicio de consultoría. • Donación de datos (B2G): Entendida como una forma de responsabilidad social corporativa. Ejemplo: Telefónica – Big data for social good , pág. 111 • Marketplace (B2B): Proveedores de datos y agentes reutilizadores se reúnen en una plataforma online a través de intermediarios de confianza.
• Acuerdos de colaboración (B2G): Acuerdos entre organismos públicos y empresas para el intercambio mutuo de datos.
Información sobre los Modelos de Relación , pág. 56 Ejemplos de casos de apertura y compartición de datos , pág. 107
Modelos de Financiación
La organización debe ser capaz de cuantificar el valor económico de la información y los costes asociados a la iniciativa de compartición o apertura de datos, tanto en infraestructura como en personal.
Para ello, son destacables varias prácticas a tener en cuenta:
• Asegurar la rentabilidad de la iniciativa , analizando el coste/beneficio e identificando los impactos tangibles e intangibles, como pueden ser los ingresos por nuevos productos o servicios, el ahorro gracias a nuevos procesos o la mejora en la imagen de marca de la empresa. • Contar con un método para establecer el valor de los datasets y establecer tarifas en caso de monetización de los datos. Existen diferentes criterios a tener en cuenta que pueden utilizarse para cuantificar el valor de los datasets y calcular tarifas.
Información sobre Modelos de Financiación , pág. 60
18
Cómo utilizar esta guía
Marco legal de los acuerdos contractuales
Normalmente, la compartición de datos se implementa a partir de un acuerdo contractual establecido previamente. En la preparación de este tipo de acuerdos se deben tener en cuenta diferentes aspectos en función del modelo de relación.
En modelos B2B : Algunas consideraciones a la hora de preparar los acuerdos: • ¿Qué datos estarán disponibles? • ¿Quién podrá acceder y reutilizar los datos? • ¿Qué podrá hacer el agente reutilizador con los datos? • ¿Qué medios técnicos se utilizarán para acceder a los datos? • ¿Qué datos es necesario proteger? • ¿Cuál será la duración del contrato?
En modelos B2G : Algunas consideraciones específicas a tener en cuenta a la hora de preparar los acuerdos con entidades públicas: • ¿Cuál es el propósito de interés público? • ¿Cuáles son los objetivos y limitaciones relacionadas con la compartición de datos? • ¿Cuáles son las condiciones para la implementación? • ¿Cuál es la compensación por la compartición de datos?
Información sobre: Marco Legal , pág. 64 Principios que guían los modelos de relación , pág. 82
Licencias para la compartición o apertura de datos
Todos los datos compartidos o abiertos deben incluir información explícita sobre sus condiciones de uso. Existen diferentes tipos de licencias que permiten establecer los requerimientos, limitaciones de uso y ámbitos de aplicación del acuerdo.
Información sobre Licencias para la compartición o apertura de datos , pág. 68
Roles, habilidades, desarrollo y gestión del talento
Roles Dentro de una iniciativa de compartición o apertura de datos, existen diferentes roles necesarios para su puesta en marcha y posterior mantenimiento, incluyendo tanto perfiles estratégicos como técnicos. Los principales son: • Sponsor o patrocinador/a: responsable de establecer la estrategia de la organización y supervisar su implementación. • Gestor/a de datos : responsable de implementar la estrategia de compartición de datos. • Implementador/a : responsable de la implementación de los requisitos técnicos. • Propietario/a de los datos : responsable de decidir sobre el acceso y uso de cada base de datos. Habilidades y desarrollo de conocimiento La organización debe asegurar que el personal tiene la formación suficiente y el soporte adecuado para llevar a cabo sus responsabilidades en relación a la gestión de los datos. Si es necesario, la organización deberá ofrecer formación que permita desarrollar estas habilidades.
Información sobre Roles, habilidades, desarrollo y gestión del talento , pág. 71
19
Cómo utilizar esta guía
1. INTRODUCCIÓN Los avances en las tecnologías digitales han hecho que actualmente todo tipo de organizaciones generen demanera permanente y exponencial grandes cantida- des de datos. Se trata de información procedente tanto de los sistemas internos de la organización como de su interacción con usuarios, proveedores y clientes. En el caso de las empresas, además, la expansión de las tecnologías como el In- ternet de las Cosas (IoT) y la Inteligencia Artificial (IA) aplicada a los procesos productivos hacen que buena parte de esos datos se generen de manera auto- mática. La recopilación y análisis de los datos de forma interna implica importantes bene- ficios para las organizaciones, como la optimización de los procesos y la mejora en la toma de decisiones, entre otros aspectos. Pero la compartición o apertura de estos datos a terceros también ofrece grandes oportunidades para el creci- miento económico, la competitividad y la innovación. En el caso de las Administraciones Públicas, la apertura de datos tiene ya un largo recorrido y ha demostrado claramente los beneficios que aporta: según la Comisión Europea, el mercado directo de los datos abiertos generará cerca de 325.000 millones de euros en el periodo 2016-2020, así como 100.000 1 em- pleos 1 . En el caso del sector privado, la compartición y apertura de datos es una práctica menos extendida, aunque cada vez más compañías están viendo sus ventajas. Esta guía tiene como objetivo revisar las ventajas de compartir datos en entornos empresariales, así como recoger una serie de recomendaciones y buenas prácticas para potenciar la reutilización de datos privados.
¹ Comisión Europea (2015): Creating value through Open Data
1.1 ¿Por qué debería compartir o abrir los datos de mi empresa?
Los principales beneficios que aporta la compartición y/o apertura de datos son la oportunidad de generar nuevas líneas de negocio dentro de la empresa y me- jorar la eficiencia interna. Existen además otras razones para compartir o abrir los datos, ya sea en entornos B2B (con otras empresas) o B2G (con administracio- nes públicas y universidades u organismos de investigación). Estos pueden ser la monetización de los datos como vía para generar beneficios adicionales, la aper- tura de colaboraciones con otras organizaciones, el posicionamiento estratégico de la compañía o el apoyo a la innovación.
Caso de éxito: BBVA Valora
El proyecto BBVA Valora ha creado un nuevo servicio online basado en datos que ofrece información útil antes de comprar o alquilar una vivienda y permite gestionar en un único lugar toda la información relacionada con la hipoteca y los gastos del hogar.
Los datos por sí solos no generan valor, y es necesario fomentar un ecosistema que permita transformar datos en información útil y nuevas oportunidades de negocio.
20
Introducción
1.2 ¿Cuál es la diferencia entre la compartición y la apertura de datos?
La apertura o compartición de datos en el ámbito empresarial significa la puesta a disposición de los datos generados de forma interna por la compañía para que puedan reutilizarlos terceros, como otras empresas u organismos públicos. Sin embargo, existen diferencias sustanciales entre ambos conceptos:
Caso de éxito: Primafrio
Empresa especializada en el transporte frigorífico terrestre. La compañía ofrece a sus clientes de manera gratuita datos relativos a la localización y el posicionamiento de su flota. Como resultado, ha conseguido optimizar el tracking de los pedidos y una mayor agilidad en los procesos de facturación.
Apertura de datos: Consiste en ofrecer los datos de forma “abierta”, mediante licencias que permiten la reutilización de los datos para que cualquiera pueda acceder a ellos, utilizarlos y compartirlos bajo unas restricciones mínimas. Estas limitaciones incluyen el cumplimiento de la legislación en materia de protección de datos y el reglamento relativo a la reutilización de datos abiertos 2 . Asimismo los datos abiertos ( Open Data , en inglés) implican la exposición de dichos datos utilizando estándares y formatos abiertos, que facilitan su reutilización. Compartición de datos: Consiste en un proceso a través del cual una empresa pone sus datos a disposición de otras, que no son ni competidoras en el mercado donde la empresa opera, ni subcontratistas, y están interesadas en usar los datos para sus propios propósitos de negocio 3 . En la compartición de datos, las empresas proveedoras tienen un mayor control sobre los datos que ponen a disposición de terceros. Estas iniciativas de compar- tición pueden adoptar diferentes formas, con modelos unilaterales o colabora- tivos y donde los datos se ofrecen a cambio de tarifas, la provisión de servicios o de manera gratuita.
2 Real Decreto 1495/2011 sobre la reutilización de la información del sector público, en la legislación vigente española. Directive (EU) 2019/1024 of the European Parliament and of the Council of 20 June 2019 on open data and the re- use of public sector information , en la nueva legislación europea. 3 Comisión Europea (2016): Study on data sharing between companies in Europe
Caso de éxito: ITI
El Instituto Tecnológico de Informática, participa en el proyecto europeo Transforming Transport. La iniciativa consiste en una plataforma industrial online donde las empresas participantes comparten sus datos en el ámbito del transporte y la logística, con el objetivo de lograr una mayor eficiencia de los procesos logísticos.
21
Introducción
Puesto que es un concepto aún poco extendido en el ámbito empresarial, es im- portante tener en cuenta que:
• Iniciar un proceso para compartir datos no implica necesariamente que la empresa ofrezca el acceso a todos sus datasets . Qué datos comparte es una decisión que debe tomar la compañía en función de su estrategia de negocio.
• La compartición no significa que se ofrezcan los datos de manera gratuita. Existen diversos modelos de negocio que incluyen el pago por acceso.
• Las empresas proveedoras de los datos son las que deciden con quién com- partirán sus datos, en qué términos, con qué condiciones de uso y el marco temporal en el que podrán ser utilizados.
1.3 ¿Por dónde empezar?
Como ya se ha apuntado, la apertura y la compartición de datos en el entorno empresarial ofrecen importantes oportunidades, tanto para grandes compañías con experiencia previa en este ámbito, como para pymes no acostumbradas a manejar grandes cantidades de datos. Además, con la expansión de la llamada Industria 4.0, muchas empresas sin experiencia previa en la gestión de Big Data han empezado a generar grandes volúmenes de datos y ha aumentado su inte- rés en buscar nuevas oportunidades para ponerlos en valor.
Caso de éxito: ArcelorMittal
La empresa siderúrgica, a través de su centro I+D en Euskadi, y Tecnalia pusieron en marcha en 2018 un datatón dirigido a resolver un problema existente sus las acerías. La compañía puso a disposición una parte de sus datos durante un tiempo limitado para que grupos formados por personas investigadoras dieran con soluciones innovadoras.
Es importante tener en cuenta que los procesos de apertura o compartición de datos implican un cambio tanto a nivel de infraestructuras técnicas como en los procesos organizacionales y, en definitiva, en la cultura de la empresa. Por ello, para aquellas compañías sin experiencia previa que quieran iniciar este cami- no, es aconsejable empezar experimentando mediante pequeños proyectos, abriendo una parte de sus datos a facilitadores o plataformas tecnológicas para valorizar su potencial. En esta guía se ofrecen diferentes alternativas para llevar a cabo estos procesos.
Caso de éxito: Euskaltel
A partir de los datos procedentes de las conexiones a las antenas de telefonía, la compañía ha desarrollado una herramienta de análisis de Big Data. Como resultado, obtiene informes que ofrece a empresas y administraciones públicas.
22
Introducción
Page 1 Page 2 Page 3 Page 4 Page 5 Page 6 Page 7 Page 8 Page 9 Page 10 Page 11 Page 12 Page 13 Page 14 Page 15 Page 16 Page 17 Page 18 Page 19 Page 20 Page 21 Page 22 Page 23 Page 24 Page 25 Page 26 Page 27 Page 28 Page 29 Page 30 Page 31 Page 32 Page 33 Page 34 Page 35 Page 36 Page 37 Page 38 Page 39 Page 40 Page 41 Page 42 Page 43 Page 44 Page 45 Page 46 Page 47 Page 48 Page 49 Page 50 Page 51 Page 52 Page 53 Page 54 Page 55 Page 56 Page 57 Page 58 Page 59 Page 60 Page 61 Page 62 Page 63 Page 64 Page 65 Page 66 Page 67 Page 68 Page 69 Page 70 Page 71 Page 72 Page 73 Page 74 Page 75 Page 76 Page 77 Page 78 Page 79 Page 80 Page 81 Page 82 Page 83 Page 84 Page 85 Page 86 Page 87 Page 88 Page 89 Page 90 Page 91 Page 92 Page 93 Page 94 Page 95 Page 96 Page 97 Page 98 Page 99 Page 100 Page 101 Page 102 Page 103 Page 104 Page 105 Page 106 Page 107 Page 108 Page 109 Page 110 Page 111 Page 112 Page 113 Page 114 Page 115 Page 116 Page 117 Page 118 Page 119 Page 120Made with FlippingBook - Online Brochure Maker