La reutilización de datos abiertos en España 2024

Un estudio sobre la capacidad de reutilización de los datos disponibles en los portales de las administraciones públicas españolas

LA REUTILIZACIÓN DE DATOS ABIERTOS EN ESPAÑA ACTUALIZACIÓN 2024

LA REUTILIZACIÓN DE DATOS ABIERTOS EN ESPAÑA

ACTUALIZACIÓN 2024

Alberto Abella, FIWARE Foundation

Marta Ortiz de Urbina Criado , Universidad Rey Juan Carlos Carmen de Pablos Heredero, Universidad Rey Juan Carlos Diego García Luna, Universidad Politécnica de Madrid

CON EL APOYO TÉCNICO DEL DEPARTAMENTO DE ESTUDIOS Y GESTIÓN DEL CONOCIMIENTO DE COTEC

ISBN: 978-84-92933-11-2

Ín DI CE

3.2.4. Categorización por el estándar técnico utilizado . . . . . . . . . . . . . . . . . . . . . . . . 40 3.2.5. Categorización por los mecanismos de acceso necesarios para el acceso a los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.2.6. Categorización por el contenido geográfico . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.2.7. Categorización por la frecuencia de actualización . . . . . . . . . . . . . . . . . . . . . . . 43 3.2.8. Categorización por difusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.2.9. Categorización por reputación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.2.10. Categorización por reutilización global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.3. Diagnóstico de la reutilización de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.3.1. Análisis del conocimiento sobre las entidades que reutilizan datos publicados . . . . . . 46 3.3.2. Análisis de reutilización de datos por sectores de actividad . . . . . . . . . . . . . . . . . . 47 3.3.3. Análisis de reutilización de datos por ámbito territorial . . . . . . . . . . . . . . . . . . . . . 52 3.3.4. Análisis de los tipos de innovación por la reutilización de datos abiertos . . . . . . . . . . 52 3.3.5. Análisis de la disponibilidad de registro de los accesos . . . . . . . . . . . . . . . . . . . . 54 3.3.6. Análisis de las actividades de promoción del uso de datos abiertos . . . . . . . . . . . . . 55 3.4. Diagnóstico de los servicios generados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.4.1. Análisis de las temáticas de los servicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.4.2. Análisis de sostenibilidad y modelos de negocio de los servicios . . . . . . . . . . . . . . . 59 3.4.3. Análisis de los autores de los servicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 3.4.4. Análisis de otras características de los servicios . . . . . . . . . . . . . . . . . . . . . . . . 60 3.4.5. Análisis de la creación de valor de los servicios . . . . . . . . . . . . . . . . . . . . . . . . . 60 4. Estimación cualitativa de servicios innovadores . . . . . . . . . . . . . . . . . . 62 4.1. Tipos de modelos de negocio identificados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.2. Análisis de los servicios por el modelo de negocio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 5. DAFO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 6.1. Conclusiones sobre los portales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 6.2. Conclusiones sobre los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 6.3. Conclusiones sobre los gestores de los portales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 6.4. Conclusiones sobre los servicios generados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 7. Recomendaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 8. Líneas futuras de trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Anexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 Anexo 1. Cuestionario a los reutilizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 Anexo 2. Ranking de portales según reputación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Anexo 3. Respuesta sobre los tres usos más comunes que los reutilizadores dan a los datos de su portal . . . . . . . . . . . . . . . . . . . . . . . . 96 Anexo 4. Respuestas a los tres juegos de datos que más se usan en su portal . . . . . . . . . . . . 102

Resumen ejecutivo ................................................ 8 Presentación del informe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Introducción de Cotec . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Introducción de DesideDatum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.1. La importancia de los datos abiertos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.2. Los datos abiertos en Europa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.3. Los datos abiertos en España . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.4. Un enfoque autonómico destacado. Administración Oberta de Cataluña . . . . . . . . . . . . . . . 24 1.5. El modelo de reutilización de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.6. Objetivo del informe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2. Metodología . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.1. Metodología de estudio de los portales que publican datos . . . . . . . . . . . . . . . . . . . . . . . 29 2.1.1. Modelo simplificado de madurez de portales que publican datos . . . . . . . . . . . . . . . 31 2.2. Metodología de estudio de los juegos de datos publicados . . . . . . . . . . . . . . . . . . . . . . . 31 2.3. Metodología de estudio de la reutilización de los datos publicados . . . . . . . . . . . . . . . . . . . 31 2.3.1. Federación de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.3.2. Consolidación de los portales de la Administración General del Estado . . . . . . . . . . . 33 3. Diagnóstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.1. Diagnóstico de los portales que publican datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.1.1. Actualización de los datos y disponibilidad de API . . . . . . . . . . . . . . . . . . . . . . . 35 3.1.2. Sistema de gestión de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.1.3. Portal de servicios desarrollados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.1.4. Madurez de los portales según la metodología . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.2. Diagnóstico de los juegos de datos publicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.2.1. Distribución por grado de madurez de los portales que los publican . . . . . . . . . . . . . 37 3.2.2. Categorización por licencia de reutilización . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.2.3. Categorización por modelo de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

ÍnDICE de figuras

ÍnDICE de tablas

Tabla 1:

Dimensiones de madurez de portales de datos en Europa . . . . . . . . . . . . . . ....... 15

Figura 1: La evolución de las dimensiones de madurez de Datos Abiertos en Europa. . . . . . . . .... 17 Figura 2: Las puntuaciones generales de madurez de los datos abiertos de la evaluación de 2022. . . . 17 Figura 3: Grupos de países en cuanto al índice de madurez en Datos Abiertos (2022) . . . . . . . . . . . 18 Figura 4: Nivel medio de madurez de la EU-27 en cada una de las cuatro dimensiones. . . . . . . . . . . 19 Figura 5 : Distribución de la madurez de portales de datos en España 2023. . . . . . . . . . . ...... 36 Figura 6: Distribución de juegos de datos por madurez de los portales que los publican 2023. . . . . . . 37 Figura 7: Distribución de juegos de datos por licencia de uso 2023 (MELODA 5). . . . . . . . . . . . . . . 38 Figura 8: Distribución de juegos de datos por modelo de datos 2023 (MELODA 5). . . . . . . . . .... 39 Figura 9: Distribución de juegos de datos por el estándar de almacenamiento utilizado 2023(MELODA5).. . . . . . . . . . . . . . . . . . . . . . . . . . . . ................ 40 Figura 10: Distribución de juegos de datos por el mecanismo de acceso utilizado 2023(MELODA5).. . . . . . . . . . . . . . . . . . . . . . . . . . . . ................ 41 Figura 11: Distribución de juegos de datos por el contenido geográfico de la información 2023(MELODA5).. . . . . . . . . . . . . . . . . . . . . . . . . . . . ................ 42 Figura 12: Distribución de juegos de datos en función de su frecuencia de actualización 2023(MELODA5).. . . . . . . . . . . . . . . . . . . . . . . . . . . . ................ 43 Figura 13: Distribución de juegos de datos en función de su difusión 2023 (MELODA 5). . . . . . . .... 44 Figura 14: Distribución de juegos de datos en función de su reputación 2023 (MELODA 5). . . . . . ... 45 Figura 15: Distribución de juegos de datos muestreados por categorías de MELODA 5, 2023. . . . . ... 46 Figura 16: Temáticas NTI-RISP de las aplicaciones en 2023 . . . . . . . . . . . . . . . . . ......... 58 Figura 17: Distribución de autores de los servicios 2023 . . . . . . . . . . . . . . . . . . .......... 59 Figura 18: Modelos de negocio de los servicios 2023 . . . . . . . . . . . . . . . . . . . . .......... 63 Figura 19: Modelos de negocio de los servicios 2021 . . . . . . . . . . . . . . . . . . . . .......... 64

Tabla 2:

Dimensiones y niveles de MELODA 5. . . . . . . . . . . . . . . . . . . . . . . ........... 25

Tabla 3:

Rangos de calificación de facilidad de reutilización en MELODA 5. .. .. .. .. .. ...... 26

Tabla 4:

Métrica para analizar el grado de madurez de los portales de datos . . . . . . . . . . ..... 30

Tabla 5:

Los portales de datos abiertos por Comunidad Autónoma 2023. . . . . . . . . . . . ...... 35

Tabla 6:

Conocimiento del tipo de reutilizadores de datos. . . . . . . . . . . . . . . . . . ......... 48

Tabla 7:

Reutilizadoresporsectordeactividad(I).. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

Tabla 8:

Reutilizadores por sector de actividad (II). . . . . . . . . . . . . . . . . . . . . .......... 50

Tabla 9: Reutilizadores por sector de actividad (III). . . . . . . . . . . . . . . . . . . . . .......... 51 Tabla 10: Ámbito de actuación de los reutilizadores de datos abiertos. . . . . . . . . . . . . ....... 53 Tabla 11: Tipos de innovación por la reutilización de datos abiertos. . . . . . . . . . . . . . . ....... 54 Tabla 12: Disponibilidad de los registros de acceso a los datos. . . . . . . . . . . . . . . . . . . . . . . . . 54 Tabla 13: Actividades de promoción del uso de datos abiertos. . . . . . . . . . . . . . . . . ........ 56 Tabla 14: Temáticas NTI-RISP de las aplicaciones en 2023 . . . . . . . . . . . . . . . . . ......... 57 Tabla 15: Creacióndevalorporlareutilizacióndelosdatos. . . . . . . . . . . . . . . . . . . . . . . . . . 61 Tabla 16: Análisis DAFO: debilidades y amenazas . . . . . . . . . . . . . . . . . . . . ........... 68 Tabla 17: AnálisisDAFO: fortalezasyoportunidades. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 Tabla 18: Ranking de portales por nivel de reputación según MELODA 5. Niveles 3 y 2 . . . . . . . . . . . 89 Tabla 19: Ranking de portales por nivel de reputación según MELODA 5. Nivel 1 . . . . . . . . . ..... 91 Tabla 20: Comparativa de los tres usos más comunes de los juegos de datos . . . . . . . . . . ..... 97 Tabla 21: Comparativa de los tres juegos de datos que más se usan . . . . . . . . . . . . . . . . . . . . 103

RESU MEN EJE CUTI VO

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

• Consumo interno. Al igual que en los informes anteriores, los mayores consumidores de los datos publicados son las propias Administraciones públicas (51,70 % en 2023, frente al 64 % que los reutilizan frecuentemente o siempre en 2021). • Falta de normalización y modelos de datos publicados. En 2023 el 69,90 % de los datos publicados —frente al 80 % en 2021— no incluye información de su estructura ni utiliza modelos de datos normalizados. • Actualización poco frecuente de los datos. Es llamativo que en 2023 este aspecto, a pesar de mejorar un poco, sigue suponiendo un reto. El 78,30 % de los datos abiertos publicados en 2023 —frente al 92 % en 2021— tiene un periodo de actualización mayor de un mes; mientras que el porcentaje de datos publicados en tiempo real ronda el 0 %. • Datos no geolocalizados. En 2023 se ha producido un empeoramiento de este aspecto: en 2021 se obtenía que el 50 % de los datos publicados no contenía ningún tipo de información geográfica, y en 2023 la cifra es del 63,60 %. • Falta de mantenimiento de los servicios de datos abiertos. El 35 % de los servicios basados en datos abiertos que se encuentran listados en los portales se encuentran inactivos o ya no existen. • Ranking de reputación de publicadores de datos abiertos. Al igual que en el informe de 2021, se ha elaborado un ranking de reputación de los portales, si bien se está trabajando en desarrollar metodologías más adecuadas para medir la reputación (Ortiz de Urbina Criado, Abella y De Pablos Heredero, 2023).

En este informe se realiza el cuarto estudio sobre la reutilización de datos abiertos con el objetivo de presentar el estado de la cuestión en 2023 y los avances que ha habido desde el primer informe elaborado en 2017. Todo esto permite desarrollar recomendaciones y líneas futuras de trabajo que ayudan a la generación de negocios y servicios para la sociedad. Para ello, se han identificado los portales de datos abiertos que hay en España en el año 2023, y se ha analizado una muestra de los juegos de datos que tienen disponibles y de los servicios basados en ellos. Además, se ha enviado un cuestionario a los responsables de los portales para analizar algunas de las características de los datos abiertos y de su potencial para ser reutilizados. En concreto, se ha hecho un diagnóstico sobre el conocimiento que tienen acerca de la reutilización de sus datos, el tipo de innovación que se puede promover con ellos, las actividades de promoción de su uso, los servicios generados y la creación de valor en torno a la reutilización de los datos. También se ha aplicado la última versión de la métrica MELODA 5 para analizar el grado de reusabilidad de los datos abiertos publicados en portales de datos abiertos españoles. Todos estos diagnósticos han permitido realizar un análisis de las oportunidades y amenazas y de las fortalezas y debilidades, a partir del cual se han incluido algunas reflexiones que pueden ayudar a construir futuras políticas públicas de gestión de datos. El estudio realizado nos permite poner de manifiesto las siguientes reflexiones sobre el ecosistema de reutilización de datos en España: • Profundización estadística. Las fuentes de datos estadísticas han incrementado su porcentaje (19,78 %) respecto a 2021 (14,58 %), y son las principales responsables del incremento de datos producido en los últimos años.

La reutilización de los datos abiertos ayuda a crear valor social y económico. Además, permite la creación de nuevas empresas que con pocos recursos propios llevan a cabo modelos de negocio basados en la elaboración de productos y servicios enriquecidos con información de valor añadido.*

*Abella, Ortiz de Urbina Criado y De Pablos Heredero (2014)

9

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

prE se ntA ción

El informe sobre reutilización de datos abiertos surgió como un proyecto puntual en la primera convocatoria PIA de Cotec, el mecanismo con el que la fundación selecciona alianzas para la generación de conocimiento en el ecosistema de innovación. Entonces, en 2017, ya intuíamos que una adecuada cultura del dato en las Administraciones era imprescindible para avanzar en derechos digitales y, al mismo tiempo, para el desarrollo de una economía del conocimiento que compita internacionalmente sin olvidar nuestros principios y valores.

Ahora, tras cuatro ediciones de este informe, ya consolidado dentro de los productos de publicación periódica que conforman el Observatorio del Informe Cotec, hemos de felicitarnos por haber elegido aquel proyecto de entre los más de mil candidatos. Pero, sobre todo, debemos felicitar a los autores y entidades colaboradoras por su capacidad para mostrar, edición tras edición, el valor creciente de los datos abiertos y compartidos. Este informe nos señala el largo camino que nos queda por recorrer, al tiempo que registra y analiza los tímidos aunque esperanzadores pasos que hemos ido dando.

DesideDatum Data Company SL 1 —más conocida por su marca DesideDatum— es la empresa española con más referencias en el ámbito de los datos abiertos. De hecho, es la única empresa en todo el mundo que es capaz de ofrecer servicios en las tres principales tecnologías a nivel mundial para la apertura de datos: Tyler-Socrata 2 , OpenDataSoft 3 y CKAN 4 . Además, DesideDatum se ha especializado en la realización de proyectos de consultoría e implementación en los principales ámbitos relacionados con el dato: • Apertura del dato (Open Data). • Gobierno y gestión del dato. • Analítica del dato. • Visualización del dato. • Transparencia y rendición de cuentas basadas en el dato.

Actualmente —septiembre 2023— tiene más de cincuenta proyectos en curso en muchas Administraciones públicas y empresas españolas, donde la innovación y la búsqueda del valor del dato son siempre los principales objetivos. Por otro lado, DesideDatum siempre ha defendido las iniciativas relacionadas con la apertura de los datos públicos; por eso, una vez más, apoyamos la realización de este estudio. Para DesideDatum abrir los datos públicos es sinónimo de compartir y multiplicar el valor y calidad que estos tienen para con todos los miembros de la sociedad. Se trata de empoderar a la sociedad, reactivar la economía e incluso mejorar los servicios altamente basados en datos (como es el caso de la inteligencia artificial).

1. https://desidedatum.com 2. https://www.tylertech.com/products/data-insights 3. https://www.opendatasoft.com 4. https://ckan.org

11

IN TRO DUC

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

1.1 La importancia de los datos abiertos

portales abiertos (Ortiz de Urbina Criado, Abella y De Pablos Heredero, 2023) a través de tres dimensiones: si el portal es conocido, si es conocido por algo, y cómo es valorado por los usuarios.

Los datos abiertos son aquellos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen (Open Data Handbook, 2023). El valor de los datos abiertos está en su reutilización. Para que los datos abiertos se puedan reutilizar es importante que cumplan unos requisitos de calidad (Hrustek, Furjan, y Pihir, 2021). Zuiderwij, Pirannejad y Susha (2021) destacan, entre otros, la importancia de la calidad del dato para poder reutilizarse. En este sentido, Abella, Ortiz de Urbina Criado y De Pablos Heredero (2022) definen el concepto de portal de datos aparente (PODP) como aquellos portales que publican datos, pero no permiten una reutilización profesional de aquellos datos que alberga. Para que un portal de datos se considere adecuado para poder reutilizarse sus datos, ha de cumplir los siguientes requisitos: 1. Tener un mecanismo de actualización que permita la entrega de información en tiempo real sobre las actualizaciones de los datos. 2. Tener un sistema de gestión de datos (DMS) para proporcionar acceso automatizado a la captura y publicación de los datos. 3. Disponer de API para publicar los datos con un mecanismo que permite ser reutilizado profesionalmente. La preocupación sobre la creación de este tipo de portales, junto con la escasez de datos abiertos en sectores clave como la salud, ha llevado a estos mismos autores a generar recientemente un índice de reputación de

1.2 Los datos abiertos en Europa

CIÓN

En Europa existe una preocupación creciente sobre la calidad de los datos abiertos (Gao, Janssen y Zhang, 2023). El Portal Europeo de Datos ( https://data.europa.eu/ ) ofrece acceso a los datos abiertos desde cualquier país europeo y promueve prácticas de publicación de datos a nivel nacional, regional e internacional. Desde 2015, de forma anual, se presentan datos comparativos de la evolución y uso de datos abiertos en países europeos. Los resultados de estas comparativas se muestran en el tablero de datos abiertos, que constituye una herramienta muy práctica para comparar el nivel de madurez de los datos abiertos en los distintos países de la Unión Europea. Carsaniga, Lincklaen Arriëns, Dogger, Van Assen y Cecconi (2022) realizan una comparativa de mejores prácticas en Europa sobre la gestión de datos abiertos y destacan los casos de Francia, Ucrania, Polonia, Irlanda, Chipre, Estonia, España e Italia como referentes que marcan tendencia en buenas prácticas. Recientemente, en agosto de 2023, en el informe europeo sobre la creación de valor en el sector público a través de la utilización de datos abiertos (Osimo y Pizzamiglio, 2023), se destacan como buenas prácticas en la reutilización de datos en el sector público los casos de Francia, Estonia y Flandes (Bélgica). La metodología, inicialmente desarrollada por Cecconi y Radu (2018), se ha ido mejorando a lo largo del tiempo y, en la actualidad, analiza el nivel de madurez de los datos abiertos en diferentes países considerando las siguientes dimensiones:

01.

13

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

1. Política de datos abiertos

político), la sociedad, el medio ambiente y el económico.

Tabla 1. Dimensiones de madurez de portales de datos en Europa

Esta dimensión se centra en las políticas y estrategias de datos abiertos existentes en los países europeos participantes. Se analizan los modelos nacionales de gobernanza y las medidas, también a nivel regional y local, aplicadas para acometer esas políticas y estrategias. Para lograr esto, la dimensión se basa en los mismos tres indicadores de años previos: el marco de políticas, la gobernanza de los datos abiertos y la implementación de datos abiertos. El 21 de diciembre de 2022 se publicó el Reglamento de Ejecución (EU) 2023/138 de la Comisión. En este Reglamento se definen seis categorías de conjuntos de datos de alto impacto: Geoespaciales, de Observación de la Tierra y Medioambiente, Meteorológicos, Estadísticos, de Empresas y de Movilidad. El Reglamento establece que los organismos del sector público de los Estados miembros deberán poner a disposición para su reutilización los datos, de forma gratuita.

DIMENSIÓN

MEDIDA

3. Portal de datos abiertos

Política de datos abiertos

Marco normativo Gobernanza de datos abiertos Implementación de datos abiertos

Esta dimensión se centra en el análisis del portal nacional de datos abiertos. Lleva a cabo un análisis en profundidad de las características y funciones avanzadas, proporcionando una experiencia de usuario exitosa. Además, la dimensión evalúa el grado en que los administradores del portal utilizan herramientas de análisis web para comprender mejor las necesidades y el comportamiento de sus usuarios y actualizar las características de un portal en consonancia con la información obtenida de estos análisis. La dimensión examina la cobertura de datos abiertos en diferentes dominios, así como el enfoque y las medidas establecidas para garantizar la sostenibilidad del portal.

Impacto de datos abiertos

Conciencia estratégica Medición de la reutilización Impacto creado Características del portal Suministro de datos Sostenibilidad del portal

Portal de datos abiertos

Calidad del portal de datos abiertos

Actualización Medidas de control Cumplimiento de DCAT-AP Calidad de la implementación y datos vinculados

4. Calidad de datos abiertos

Fuente: Elaboración propia.

2. Impacto de datos abiertos

Se centra en las medidas adoptadas por los gestores del portal para garantizar la recopilación sistemática de metadatos de fuentes de todo el país, así como la actualización de los metadatos disponibles y, cuando sea posible, los datos reales. Se supervisa el cumplimiento de la norma de metadatos DCAT- AP, actualmente publicada su versión 2.1.1, así como la calidad de la implementación de los datos publicados. Se proporcionan elementos para valorar la calidad para los gestores de portales y los responsables políticos, como el uso de datos abiertos en formatos y licencias, que los datos sean legibles por cualquier máquina y de alta calidad, y sean adecuados para un enfoque de datos enlazados. A continuación, en la Tabla 1 se muestran las medidas que se utilizan para cada una de las dimensiones:

La segunda dimensión analiza la voluntad, preparación y capacidad de los países europeos para medir tanto la reutilización como el impacto de los datos abiertos. En primer lugar, la dimensión investiga cómo los países están preparados para medir el nivel de reutilización y el impacto de los datos abiertos dentro de su territorio. Esto refleja el primer indicador, la conciencia estratégica, que también se utilizó en ediciones anteriores del estudio. En segundo lugar, se hace hincapié en si los países miden la reutilización de datos abiertos y con qué métodos y de qué manera. Por último, la dimensión se centra en la recopilación de datos sobre el impacto creado dentro de las cuatro áreas de impacto que se han considerado en las evaluaciones de madurez de datos abiertos anteriores, a saber, el gobierno (anteriormente

De acuerdo con el último informe de madurez de datos abiertos (Carsaniga et al., 2022), se puede afirmar que (Figura 1): • Los Estados miembros de la UE se preparan para el reglamento de aplicación de los conjuntos de datos de alto valor. Aunque el Reglamento aún no se ha adoptado, la evaluación de este año ofrece una visión general del nivel de preparación de los Estados miembros de la UE para cumplir los requisitos en las cuatro dimensiones de la madurez de los datos abiertos. El 96 % de los Estados miembros de la UE están trabajando en la identificación de los datos en los dominios de datos de alto

valor que deben ser priorizados para su publicación, especialmente estadísticas, categorías de datos geoespaciales, de observación de la Tierra y del medio ambiente y meteorológicos. El 85 % de los 27 Estados miembros de la UE ya se están preparando para supervisar y medir el nivel de reutilización de conjuntos de datos de alto valor, y todos ellos pretenden promover o ya están promoviendo conjuntos de datos de alto valor en su portal. Por último, el 63 % de los países de la UE se están preparando para garantizar la interoperabilidad de los conjuntos de datos de alto valor con los conjuntos de datos disponibles de otros países.

14

15

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

• Medir el impacto de los datos abiertos es una prioridad para los Estados miembros de la UE, pero también un gran desafío. En 2022, la dimensión de impacto experimentó la mayor disminución en comparación con las otras dimensiones, pasando del 78 % en 2021 al 71 % en 2022. Esta caída de siete puntos porcentuales está en línea con la reestructuración metodológica de la dimensión, lo que también hace difícil comparar perfectamente los indicadores de 2022 con los de años anteriores. Además, este resultado no debería considerarse tanto como una disminución del nivel de madurez de los países de la UE. El hecho de que los países sigan obteniendo una puntuación elevada en el indicador de conciencia estratégica —que también se utilizó en la evaluación de 2021— demuestra que la UE de los 27 sigue estando muy interesada en comprender y captar la reutilización de datos abiertos y la creación de valor, como se señaló en las tendencias de la evaluación del año pasado. Por el contrario, la disminución de la dimensión de impacto proporciona una imagen más precisa de la dificultad de los países de la UE para distinguir y evaluar la reutilización de datos abiertos y el impacto resultante. Mientras que en el seguimiento y la medición de la reutilización siguen siendo bastante avanzados (la media de la UE es del 75 %, al igual que el año pasado), la recopilación de datos sobre el impacto creado, especialmente desde una perspectiva económica, parece ser más difícil para los países.

• En un mundo pospandemia, los países europeos se enfrentan a nuevos y viejos desafíos comunes. De un año a otro, los Estados miembros de la UE se han estado recuperando de la pandemia, por ejemplo, aprovechando los datos abiertos para el desarrollo de estadísticas, paneles y aplicaciones de alerta. El año 2022, la agresión rusa a Ucrania y las consecuencias de este conflicto para la economía europea y el mercado de la energía sentaron las bases para nuevos retos socioeconómicos a escala europea. Ucrania ha informado de que la guerra ha tenido un impacto significativo en su trabajo sobre los datos abiertos, especialmente porque los recursos de Internet de Ucrania (en particular los de propiedad estatal) no han estado disponibles temporalmente. La gran mayoría (18) de los Estados miembros de la UE-27 se sitúa por encima de la media de la UE-27. El nivel de madurez de datos abiertos ha ido mejorando. El potencial de los datos abiertos también fue aprovechado por otros países de Europa para responder a las consecuencias de la guerra en Ucrania. Por ejemplo, algunos países han informado de que utilizan datos abiertos para vigilar el nivel de uso de energía o para facilitar la integración de los refugiados ucranianos en su mercado de trabajo. A continuación, en la Figura 2 se presentan las puntuaciones generales de madurez de los datos abiertos de cada uno de los 35 países que participan en la evaluación de 2022, de acuerdo con el Informe de Madurez de Datos Abiertos.

Figura 1. La evolución de las dimensiones de madurez de datos abiertos en Europa

100%

90%

80%

70%

60%

50%

40%

30%

20%

10%

0%

2015

2016

2017

2018

2019

2020

2021

2022

Policy

Impact

Portal

Quality

EU27 Average

Fuente: Carsaniga et al. (2022: 7).

Figura 2. Las puntuaciones generales de madurez de los datos abiertos de la evaluación de 2022

100%

90%

80%

79% 75%

70%

60%

50%

40%

30%

20%

10%

0%

Promedio EU27

Promedio EU27 +

Fuente: Carsaniga et al. (2022: 9).

16

17

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

La Figura 3 muestra las agrupaciones que se obtienen de acuerdo con este índice de madurez. Se observa que los países se agrupan de menor a mayor en el índice en cuatro categorías: principiantes, seguidores, seguidores rápidos y creadores de tendencias. El gráfico muestra que: • La madurez de los países europeos se concentra en el extremo superior del espectro (por encima del 65 %). • El agrupamiento de creadores de tendencias está formado por los ocho países de mayor

La Figura 4 presenta el nivel medio de madurez de la EU-27 en cada una de las cuatro dimensiones y se compara con las cifras el año previo, obteniéndose las siguientes conclusiones: • Todas las cifras muestran una ligera disminución o la misma puntuación que el año pasado. Las dimensiones con menor puntuación son la política y el impacto, que en 2021 tuvieron varios cambios en la metodología. • Al igual que en 2021 y 2020, la política es la dimensión más madura, con una puntuación del 86 %. • La dimensión de impacto muestra una disminución de siete puntos porcentuales, lo que refleja la metodología actualizada y las preguntas dirigidas a medir con mayor precisión el progreso de los diferentes países.

Figura 4. Nivel medio de madurez de la EU-27 en cada una de las cuatro dimensiones

Policy

Impact

86 %

71 %

87 %

78 %

2021

2021

2022

2022

rendimiento: Francia, Ucrania, Polonia, Irlanda, Chipre, Estonia, España e Italia.

Portal

Quality

• Los cinco países incluidos en el grupo de seguimiento rápido muestran puntuaciones muy similares, ya que el grupo se concentra en un rango del 3 % (88 a 91 puntos porcentuales).

83 %

77 %

83 %

77 %

Figura 3. Grupos de países en cuanto al índice de madurez en Datos Abiertos (2022)

2021

2021

2022

2022

Fuente: Carsaniga et al. (2022: 10).

CH

AT

SI

FR

• La dimensión portal se mantiene estable desde el año pasado y es la segunda más madura. • La dimensión de la calidad muestra una mejora limitada y es la tercera más madura. Adicionalmente, los informes europeos (Carsaniga et al., 2020; Osimo y Pizzamiglio, 2023) destacan otras tendencias que constituyen buenas oportunidades para el desarrollo y mejora de la gestión de datos abiertos en el contexto europeo:

• Recursos humanos y habilidades. Varios países destacan la falta de recursos humanos asignados a los datos abiertos y la ausencia de habilidades adecuadas de datos y alfabetización entre los funcionarios públicos (Carsaniga et al., 2020). • Disponibilidad de recursos financieros. Este desafío se refiere, por ejemplo, a encontrar un presupuesto recurrente para conjuntos de datos específicos (conjuntos de datos de alto valor), así como a no tener un presupuesto planificado (Carsaniga et al., 2020).

LU

NO

UA

NL

CY

RO

EE

HU

BG

DE

DK

PL

FI

CZ

ES

RS

BE

PT

IE

IS

LT

IT

HR

ME

LV SK GR

SE

BA

AL

MT

10 %

15 % 20 % 25 % 30 % 35% 40 % 45 % 50 % 55 % 60 % 65 % 70 % 75 % 80 % 85 % 90 % 95 % 100 %

FAST- TRACKERS

trend- setters

BEGGINERS

FOLLOWERS

Fuente: Carsaniga et al. (2022: 9).

18

19

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

• Cuestiones de coordinación. La UE de los 27 informa a menudo de dificultades para permitir una gobernanza fluida de la gestión de datos en todos los niveles de gobierno (Carsaniga et al., 2020). • Compromiso con el tema de los datos abiertos. Incentivar a los diferentes actores para que proporcionen y utilicen datos abiertos es un reto ampliamente difundido en toda la UE (Carsaniga et al., 2020). • Un aspecto adicional de la publicación de datos abiertos es la necesidad de más apoyo, en términos legales, técnicos y financieros, cuando se trata de la publicación de datos abiertos de alta calidad (Carsaniga et al., 2020). • En lo que respecta a la sensibilización y la comunicación, cualquier acción debe incluir también ejemplos de reutilización de datos por parte del sector público. La recopilación y comunicación de estos ejemplos y casos de uso ayuda enormemente a comprender la importancia del papel del sector público como reutilizador de datos (Osimo y Pizzamiglio, 2023). • En lo que respecta a la política y la regulación, sería beneficioso alinear las actividades de mejora de la legislación y los planes de trabajo de la Comisión Europea con las actividades de publicación de datos abiertos, a fin de explorar mejor las necesidades de datos internos. Además, sería útil facilitar una alineación similar y un análisis de las necesidades de datos para todas las Administraciones públicas europeas. Por ejemplo, esto podría hacerse proporcionando ejemplos, mejores prácticas y metodologías sobre la manera de determinar las necesidades de datos con

1.3 Los datos abiertos en España

fines normativos y reglamentarios (Osimo y Pizzamiglio, 2023). • Deberían revisarse las actividades de vigilancia existentes, como las encuestas, para garantizar que el sector público incluya la reutilización de los datos. Sería útil crear un grupo de usuarios, basado en la amplia comunidad existente, que pudiera utilizarse para realizar nuevas encuestas (Osimo y Pizzamiglio, 2023). • El papel de los administradores de datos sigue siendo fundamental para favorecer la reutilización. Por lo tanto, los ejemplos, las mejores prácticas y las metodologías sobre el papel de los administradores de datos deben incluirse en las actividades de apoyo, no específicamente para los reutilizadores del sector público, sino en general (Osimo y Pizzamiglio, 2023). Las características de los portales de datos abiertos nacionales van más allá de permitir simplemente a los usuarios encontrar conjuntos de datos disponibles. Hay un enfoque común en la interacción entre los publicadores de datos y los reutilizadores a través de foros de discusión, sistemas de retroalimentación específicos de datos y sistemas de calificación. A través de ejemplos, los portales exponen valiosos casos de reutilización de datos abiertos (Carsaniga et al., 2020). Las mejores prácticas sobre cada una de las dimensiones de madurez de los datos abiertos que se exploran en este informe pueden ser de gran beneficio para que todos los países de Europa y fuera de ella se inspiren, aprendan y apliquen para mejorar sus propias prácticas. España es uno de los países que marca tendencia en cuanto a la gestión de datos abiertos (Carsaniga et al., 2020).

seguida por Cataluña, Andalucía y Comunidad Valenciana, con pesos del 13, 11 y 9 % respectivamente. El resto de las comunidades autónomas aglutinan el 28 % restante de las empresas infomediarias (ASEDIE, 2023). Los cuatro subsectores con más peso representan un 75 % de los empleados totales del sector, y destaca «Información geográfica» con un 30 % del total. Tras él se encuentran, con un porcentaje similar, «Económico financiero», «Consultoría técnica» y «Estudios de mercado». El resto representan el 25 % del mercado, todos por debajo del 10 % (ASEDIE, 2023). Del total de empresas infomediarias, el 68 % tiene menos de 20 años de antigüedad: un 32 % tiene entre 11 y 20 años, y un 36 % menos de 10. El 64 % de ellas fueron creadas hace más de 10 años. La edad media de las empresas es de 16 años. En el último año se han creado 40 empresas. «Editoriales» es el único subsector donde la mayoría de las empresas tienen más de 20 años. En el otro extremo están «Turismo» y «Meteorológico», que tienen un 100 y un 85 % de empresas, respectivamente, con menos de 20 años. El resto de los subsectores tiene entre el 60 y el 80 % de empresas con menos de 20 años (ASEDIE, 2023). El volumen de empresas detectadas dentro del sector infomediario ha crecido casi un 60 % desde los inicios de este informe en 2013. El número de empresas infomediarias identificadas en España, en diciembre 2021, es de 710. El número de empleados de las 542 empresas de las que se dispone de datos de empleados asciende a 22.663, y el beneficio neto agregado de las 506 empresas de las que se dispone de datos de resultados asciende a 181.707.060 euros (ASEDIE, 2023). Las comunidades autónomas que más han crecido desde entonces (en proporción) son Cantabria (400 %), Murcia (300 %) y

En la última edición del Informe de la Economía del Dato en el sector infomediario, realizada por ASEDIE, se incluyen resultados sobre un análisis de 542 compañías que tienen modelos de negocio basados en datos, donde se pone de manifiesto que la base de la toma de decisiones depende más que nunca de la información y de los datos y, en ocasiones, ni siquiera somos conscientes de este acto la digitalización (ASEDIE, 2023). Los avances en inteligencia artificial, el Internet de las cosas, son realidades que evolucionan a un ritmo cada vez mayor y que están provocando una transformación en el sistema económico. Los datos, su gestión y análisis se han convertido en el elemento necesario para el progreso empresarial, lo que convierte al sector infomediario en uno de los más influyentes de nuestra economía (ASEDIE, 2023). En este mismo informe se destaca que se ha producido un incremento del sector infomediario del 12,1 % frente a un crecimiento del PIB nacional del 7,6 % (ASEDIE, 2023). Se reconoce que la mayor digitalización de procesos y el aumento de atención de las empresas a la calidad de los datos mejoran las expectativas de reutilización de la información. Aumenta progresivamente la «cultura del dato» en nuestro país, que por otro lado marca tendencia en gestión de datos abiertos en la UE (ASEDIE, 2023), tal y como se ha descrito en el epígrafe previo. Las empresas infomediarias son más activas en unas zonas que otras en España. El sector se encuentra representado en todas las comunidades autónomas del territorio nacional y en la ciudad autónoma de Melilla. La Comunidad de Madrid, con el 39 %, es la comunidad autónoma con más empresas infomediarias,

20

21

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

LA REUTILIZACIÓN DE DATOS ABIERTOS IV

Extremadura (300 %); y en volumen, Madrid (83), Andalucía (54) y la Comunidad Valenciana (45). La única comunidad autónoma que ha decrecido es Cataluña, y en la única en que no se ha detectado ninguna empresa es la ciudad autónoma de Ceuta (ASEDIE, 2023). El 74 % de los encuestados del sector académico, el 71 % del sector privado y el 73 % del sector público han indicado que conocen la normativa europea sobre las seis categorías de los conjuntos de datos públicos de alto valor. Los encuestados del sector público, que son a la vez proveedores y reutilizadores de información pública, destacan que las barreras más importantes que encuentran a la hora de reutilizar información son (ASEDIE, 2023): • La información proporcionada en los datos no es homogénea (41,9 %). • Los conjuntos de datos no están disponibles en todas las CC. AA. o en todos los Ayuntamientos (41 %). • La falta de actualización de los datos (38,1 %). En lo relativo a las barreras a la hora de reutilizar datos, tanto el sector académico como el privado coinciden en que las principales barreras son (ASEDIE, 2023): • La falta de actualización de los datos.

informe de 2021 se detectó, como vía para evitar estas barreras, un aumento significativo de datos federados (Abella, Ortiz de Urbina Criado, De Pablos Heredero y García Luna, 2021) que se ha mantenido en la actualidad. En cuanto al impacto de la utilidad de los datos abiertos, el 88 % de los encuestados del sector académico que tienen conocimiento de los conjuntos de alto valor creen que son realmente útiles para su institución. El 96 % de las empresas encuestadas que tienen conocimiento de los conjuntos de datos de alto valor creen que son realmente útiles para su negocio. El 77 % de los encuestados del sector público que tienen conocimiento de los conjuntos de datos de alto valor han indicado que su organismo es responsable de alguno de ellos. 72 % de los encuestados del sector público que han indicado que su organismo es responsable de alguno de los conjuntos de datos de alto valor han señalado que llegarán a publicar los datos en el tiempo establecido —16 meses— (ASEDIE, 2023). En cuanto al impacto académico y de negocio, el 54 % de los encuestados del sector privado que tienen conocimiento de las seis categorías de datos de alto valor han indicado que hasta este momento pagaban por algunos de los datos recogidos en las categorías, y el 93 % de ellos han afirmado que la gratuidad de los datos tendrá un impacto positivo en su presupuesto. Con relación al sector académico, solo el 13 % de los encuestados que tienen conocimiento de los datos de alto valor suelen pagar por su uso; sin embargo, todos los encuestados afirman que la gratuidad de los datos facilitará llevar a cabo proyectos de investigación (ASEDIE, 2023). El 95 % de los encuestados afirman que sería beneficioso contar con una relación o compendio de las normativas existentes que afectan directamente al acceso, a la publicación y a la reutilización de los datos

del sector público. El 65 % de los encuestados que demandan la relación o compendio de las normativas afirman que ayudaría para avanzar en la formación e información de los actores del ecosistema del dato, y el 59 % mencionan que ayudaría a que la puesta en la práctica de las distintas normativas fuese más clara y fácil (ASEDIE, 2023). El 63 % de los encuestados afirman que usan los datos todos los días o como mínimo una vez a la semana. Los datos más demandados son estadísticos, información sobre el sector público y geoespacial. El 61 % de los encuestados afirman que utilizan los datos publicados en el portal de datos.gob.es. El 66 % de los encuestados afirman que utilizan los datos publicados en otros portales nacionales. El 77 % de los encuestados que usan estos portales han indicado que acceden al portal del Instituto Nacional de Estadística, y el 52 % al portal del Centro Nacional de Información Geográfica. El 67 % de los encuestados indican que utilizan los datos publicados a nivel autonómico. Aunque el uso es similar en todas las comunidades, cabe destacar el uso de los portales de la Comunidad de Madrid, la Junta de Andalucía y la Generalitat catalana (ASEDIE, 2023). La creación de portales de datos abiertos no implica que los datos que publican estén preparados para su reutilización profesional. Las organizaciones que ofrecen portales de datos abiertos han de considerar que uno de los valores que aportan los datos radica en su capacidad de reutilización, por lo que deben tratar de definir y crear portales abiertos cuyas características permitan una adecuada reutilización de los datos (Abella, Ortiz de Urbina, De Pablos Heredero, 2022). El interés político por implementar proyectos de gobierno abierto ha producido cierta confusión y ambigüedad (Gil García, Gasco Hernández y Parto, 2020). Concretamente para el caso de

España, hemos identificado un número elevado de lo que hemos denominado portales aparentes (PODP) (Abella et al., 2022), puesto que se trata de portales de datos abiertos que contienen datos, pero que no son adecuados para su reutilización. Cetina (2021) hace referencia a la necesidad de trabajar en los «datos con propósito» para que sean útiles. Ortiz de Urbina Criado, Abella y De Pablos Heredero (2023) analizan la reputación de los portales de datos abiertos considerando que es el reconocimiento colectivo de la capacidad demostrada por el portal para ofrecer de forma sistemática datos abiertos reusables y permitir la creación de valor a partir de ellos. Los autores parten de las tres dimensiones propuestas por Lange, Lee y Dai (2011) para medir la reputación: • El grado en el que «es conocido» (difusión y conocimiento del portal de datos). • La media en la que es «conocido por algo» (por ejemplo, por su grado de madurez, sus conjuntos de datos, los servicios desarrollados por sus datos o por su innovación). • La generalized favorability (opinión de los agentes reutilizadores del ecosistema). Contar con métricas fiables que permitan medir la calidad de los datos que albergan los portales de datos abiertos, de cara a su reutilización, es muy relevante. La reputación de los portales puede ser un estímulo para su mejora continua. En este informe se realiza una evaluación de portales de datos abiertos en España, aplicando la última versión de la métrica MELODA (Abella, Ortiz de Urbina, De Pablos Heredero, 2019).

• La falta de disponibilidad. • La dificultad en su acceso.

La federación de datos permite redistribuir un conjunto de datos abierto desde su dominio original u otro dominio en su totalidad o en parte. Es una manera de recoger fuentes externas de datos en dominios que habitualmente son más visitados de forma activa. En este sentido, en el

22

23

Page 1 Page 2-3 Page 4-5 Page 6-7 Page 8-9 Page 10-11 Page 12-13 Page 14-15 Page 16-17 Page 18-19 Page 20-21 Page 22-23 Page 24-25 Page 26-27 Page 28-29 Page 30-31 Page 32-33 Page 34-35 Page 36-37 Page 38-39 Page 40-41 Page 42-43 Page 44-45 Page 46-47 Page 48-49 Page 50-51 Page 52-53 Page 54-55 Page 56-57 Page 58-59 Page 60-61 Page 62-63 Page 64-65 Page 66-67 Page 68-69 Page 70-71 Page 72-73 Page 74-75 Page 76-77 Page 78-79 Page 80-81 Page 82-83 Page 84-85 Page 86-87 Page 88-89 Page 90-91 Page 92-93 Page 94-95 Page 96-97 Page 98-99 Page 100-101 Page 102-103 Page 104-105 Page 106-107 Page 108

Made with FlippingBook - Online Brochure Maker