III Informe de reutilización de datos abiertos

LA REUTILIZACIÓN

DE DATOS ABIERTOS III

Octubre 2021

1

2

3

4

Alberto Abella, FIWARE Foundation Marta Ortiz de Urbina Criado, Universidad Rey Juan Carlos Carmen De Pablos Heredero, Universidad Rey Juan Carlos Diego García Luna, Universidad Politécnica de Madrid

5

La reutilización de datos abiertos III. Octubre 2021 Alberto Abella, Marta Ortiz de Urbina Criado, Carmen De Pablos Heredero, Diego García Luna

Todos los derechos reservados. Cualquier forma de reproducción, distribución, comunicación pública o transformación de esta obra solo puede ser realizada con la autorización de sus titulares, salvo las excepciones previstas por la ley.

Diríjase a CEDRO (Centro Español de Derechos Reprográficos) si necesita fotocopiar o escanear algún fragmento de esta obra (www.cedro.org).

© 2021, ESIC EDITORIAL Avda. de Valdenigrales, s/n, 28223 Pozuelo de Alarcón (Madrid) Tel. 91 452 41 00 www.esic.edu/editorial

ISBN: 978-84-18944-42-0 Depósito legal: M-36461-2021

Diseño y maquetación: Gerardo Domínguez Impresión: Gráficas Dehon

Un libro de

Impreso en España - Printed in Spain

Este libro ha sido impreso con tinta y papel sostenibles.

6

Índice general

1 Resumen ejecutivo

12 14 14 15 16 18 18 19 25 29 31 32 32 33 34 35 36 36 37 38 38 39 39 39 40 40 40 40 41 42

2 Presentación de informe

2.1 Presentación de ESIC 2.2 Presentación de COTEC

2.3 Presentación de desideDatum

3 Introducción

3.1 La importancia de los datos abiertos 3.2 Los datos abiertos en Europa 3.3 Los datos abiertos en España 3.4 El modelo de reutilización de datos

3.5 Objetivo del informe

4 Metodología

4.1 Metodología de estudio de los portales que publican datos

4.1.1 Modelo simplificado de madurez de portales que publican datos

4.2 Metodología de estudio de los juegos de datos publicados 4.3 Metodología de estudio de la reutilización de los datos publicados

4.3.1 Federación de datos

4.3.2 Consolidación de los portales de la Administración General del Estado

4.4 Metodología de estudio de la reutilización de los datos publicados

5 Diagnóstico

5.1 Diagnóstico de los portales que publican datos

5.1.1 Actualización de los datos y disponibilidad de API

5.1.2 Sistema de gestión de datos 5.1.3 Portal de servicios desarrollados

5.1.4 Madurez de los portales según la metodología

5.2 Diagnóstico de los juegos de datos publicados

5.2.1 Distribución por grado de madurez de los portales que los publican

5.2.2 Distribución según la madurez de los portales 5.2.3 Categorización por licencia de reutilización 5.2.4 Categorización por modelo de datos

7

5.2.5 Categorización por el estándar técnico utilizado 42 5.2.6 Categorización por los mecanismos de acceso necesarios para el acceso a los datos 43 5.2.7 Categorización por el contenido geográfico 43 5.2.8 Categorización por la frecuencia de actualización 44 5.2.9 Categorización por difusión 44 5.2.10 Categorización por reputación 45 5.2.11 Categorización por reutilización global 45 5.3 Diagnóstico de la reutilización de datos 46 5.3.1 Análisis del conocimiento sobre las entidades que reutilizan datos publicados 46 5.3.2 Análisis reutilización de datos por sectores de actividad 48 5.3.3 Análisis reutilización de datos por ámbito territorial 52 5.3.4 Análisis de los tipos de innovación por la reutilización de datos abiertos 53 5.3.5 Análisis de la disponibilidad de registro de los accesos 54 5.3.6 Análisis de las actividades de promoción del uso de datos abiertos 54 5.4 Diagnóstico de los servicios generados 56 5.4.1 Análisis de las temáticas de los servicios 56 5.4.2 Análisis de sostenibilidad y modelos de negocio de los servicios 57 5.4.3 Análisis de los autores de los servicios 57 5.4.4 Análisis de otras características de los servicios 58 5.4.5 Análisis de la creación de valor de los servicios 58 6 Estimación cualitativa de servicios innovadores 60 6.1 Tipos de modelos de negocio identificados 60 6.2 Análisis de los servicios por el modelo de negocio 61 7 DAFO 62 8 Conclusiones 64 8.1 Conclusiones sobre los portales 64 8.2 Conclusiones sobre los datos 64 8.3 Conclusiones sobre los gestores de los portales 65 8.4 Conclusiones sobre los servicios generados 65 9 Recomendaciones 66 10 Líneas futuras de trabajo 68 11 Bibliografía 70 12 Anexos 74 12.1 Cuestionario a los reutilizadores 74 12.2 Cuestionario a los responsables de portales de datos abiertos sobre la reputación de los datos publicados 80 12.3 Ranking de portales según reputación 81 12.4 Respuesta sobre los tres usos más comunes que los reutilizadores dan a los datos de su portal 86 12.5 Respuestas a los tres juegos de datos que más se usan en su portal 88

8

Índice de figuras

Figura 1. La evolución de las dimensiones de madurez de datos abiertos en Europa 21 Figura 2. Las puntuaciones generales de madurez de los datos abiertos de la evaluación de 2020 22 Figura 3. Grupos de países en cuanto al índice de madurez en datos abiertos (2020) 22 Figura 4. Nivel medio de madurez de la EU-27 en cada una de las cuatro dimensiones 23 Figura 5. Distribución de la madurez de portales de datos en España 2019 y 2021 40 Figura 6. Distribución de juegos de datos por madurez de los portales que los publican 2021 41 Figura 7. Distribución de juegos de datos por licencia de uso 2021 (MELODA 5) 41 Figura 8. Distribución de juegos de datos por modelo de datos 2021 (MELODA 5) 42 Figura 9. D istribución de juegos de datos por el estándar de almacenamiento utilizado 2021 (MELODA 5) 42 Figura 10. D istribución de juegos de datos por el mecanismo de acceso utilizado 2021 (MELODA 5) 43 Figura 11. Distribución de juegos de datos por el contenido geográfico de la información 2021 (MELODA 5) 43 Figura 12. D istribución de juegos de datos en función de su frecuencia de actualización 2021 (MELODA 5) 44 Figura 13. Distribución de juegos de datos en función de su difusión 2021 (MELODA 5) 44 Figura 14. Distribución de juegos de datos en función de su reputación 2021 (MELODA 5) 45 Figura 15. Distribución de juegos de datos muestreados por categorías de MELODA 5, 2021 45 Figura 16. Conocimiento de los reutilizadores de datos ( %) 46 Figura 17. Temáticas NTI-RISP de las aplicaciones en 2021 57 Figura 18. Distribución de autores de los servicios 2021 58 Figura 19. Modelos de negocio de los servicios 2021 60 Figura 20. Modelos de negocio de los servicios 2019 61

9

10

Índice de tablas

Tabla 1. Dimensiones y niveles de MELODA 5

30 31 33 38 47 49 50 51 52 53 54 55 56 59 62 81 84 86 88

Tabla 2. Rangos de calificación de facilidad de reutilización en MELODA 5

Tabla 3. Métrica para analizar el grado de madurez de los portales de datos

Tabla 4. Los portales de datos abiertos por comunidad autónoma

Tabla 5. Conocimiento del tipo de reutilizadores de datos

Tabla 6. Reutilizadores

1. Reutilizadores por sector de actividad (I) 2. Reutilizadores por sector de actividad (II) 3. Reutilizadores por sector de actividad (III)

Tabla 7. Ámbito de actuación de los reutilizadores de datos abiertos

Tabla 8. Tipos de innovación por la reutilización de datos abiertos

Tabla 9. Disponibilidad de los registros de acceso a los datos

Tabla 10. Actividades de promoción del uso de datos abiertos

Tabla 11. Temáticas NTI-RISP de las aplicaciones en 2021

Tabla 12. Creación de valor por la reutilización de los datos

Tabla 13. Análisis DAFO

Tabla 14. Ranking de portales por nivel de conocimiento

Tabla 15. Ranking de portales por nivel de reputación

Tabla 16. Respuestas de los tres usos más comunes a los datos del portal

Tabla 17. Comparativa de los tres juegos de datos que más se usan 2017, 2019, 2021

11

Resumen ejecutivo

1

L a sociedad actual se basa en el tratamiento masivo de los datos y en el desarrollo de la digitalización de las ciudades (ciudades inteligentes) y de los objetos que nos rodean (Internet de las cosas). Instituciones públicas y empresas son grandes proveedores de datos, muchos de los cuales pue- den reutilizarse para crear valor en dimensiones como la económica, social y medioambiental. La reutilización de los datos abiertos permite crear valor para la sociedad como consecuencia de la oferta de nuevos productos y servicios digitales y la dinamización de la actividad económica y empresarial (Abella, Ortiz de Urbina Criado y De Pablos Heredero, Vidal Cabo y Ferrer Sapena, 2019). Entre otras cosas, la reutilización de datos ha permitido la creación de nuevas empresas que con pocos recursos propios llevan a cabo modelos de negocio basados en la elaboración de productos y servicios enriquecidos con información de valor añadido (Marcos Martín y Soriano Maldonado, 2011; Abella, Ortiz de Urbina Criado y De Pablos-Heredero, 2014). En este informe se realiza el tercer estudio sobre la reutilización de datos abiertos con el objetivo de presentar el estado de la cuestión en 2021 y los avances que han habido desde el primer informe elaborado en 2017. De esta forma, se pueden desarrollar directrices y recomendaciones ac- tualizadas que ayuden a la generación de negocios. Para ello, se han iden- tificado los portales de datos abiertos que hay en España, en 2021, y se ha analizado una muestra de los juegos de datos que tienen disponibles y de los servicios basados en ellos. Además, se ha enviado un cuestionario a los responsables de los portales para analizar algunas de las caracte- rísticas de los datos abiertos y de su potencial para ser reutilizados. En concreto, se ha hecho un diagnóstico sobre el conocimiento que tienen acerca de la reutilización de sus datos, sobre el tipo de innovación que se puede promover con ellos, sobre las actividades de promoción del uso de datos, sobre los servicios generados y sobre la creación de valor en torno a la reutilización de los datos. También se ha aplicado la última versión de la métrica MELODA 5 para analizar el grado de reusabilidad de los datos abiertos publicados en portales de datos abiertos españoles. Todos es- tos diagnósticos han permitido realizar un análisis de las oportunidades y amenazas y de las fortalezas y debilidades, a partir del cual se han incluido algunas reflexiones que pueden ayudar a construir futuras políticas públi - cas de gestión de datos.

12

El estudio realizado permite poner de manifiesto las siguientes evidencias y reflexiones sobre el ecosistema de reutilización de datos en España:

• IRRUPCIÓN ESTADÍSTICA. Las fuentes de datos estadísticos han irrum- pido dentro de los portales de datos abiertos, siendo mayoritariamente responsables del incremento de juegos de datos producido desde 2019: 45 %, cuando el número de portales tan solo ha crecido un 3,4 %. • MANTENIMIENTO EN LAS PRESTACIONES MEDIAS DE PUBLICA- CIÓN DE DATOS. Se ha producido un leve descenso porcentual de la publicación de datos en portales con altas prestaciones, descendiendo del 74 %, en 2019, al 72 % en 2021. • CONSUMO INTERNO. Hoy por hoy, según los responsables de los por- tales de datos, los mayores consumidores de los datos publicados son las propias Administraciones Públicas (64 % frecuente o siempre reuti- lizan), así como los mayores generadores de servicios (41 %). • FALTA DE NORMALIZACIÓN Y MODELOS DE DATOS PUBLICADOS. Un 80 % de los datos publicados no incluyen información de su estruc- tura ni utilizan modelos de datos normalizados. • HERRAMIENTAS INADECUADAS PARA LA PUBLICACIÓN DE DATOS. El uso de herramientas no específicas para la gestión de un portal de datos abiertos (63 %) está limitando el desarrollo de servicios, por ejemplo, por la falta de automatización del acceso a los mismos. • ACTUALIZACIÓN POCO FRECUENTE DE LOS DATOS. El 92 % de los datos abiertos publicados tienen un periodo de actualización mayor de un mes; mientras que el porcentaje de datos publicados en tiempo real es menor del 0,3 %. • DATOS NO GEOLOCALIZADOS. Se observa que todavía el 50 % de los datos publicados no contiene ningún tipo de información geográfica. • FALTA DE MANTENIMIENTO DE LOS SERVICIOS DE DATOS ABIER- TOS. El 17 % de los servicios basados en datos abiertos que se encuen- tran listados en los portales están inactivos o ya no existen. • RANKING DE REPUTACIÓN DE PUBLICADORES DE DATOS ABIER- TOS. La nueva versión de MELODA (MELODA 5) requiere de la evalua- ción de la reputación de los publicadores de datos abiertos. Se incluye ese ranking para los portales en los que se han hecho muestreos de juegos de datos y que han sido valorados por los propios responsables de los portales de datos abiertos (ver Anexo 12.3).

13

Presentación de informe

2

El informe de 2021 está disponible en dos idiomas (español e inglés), lo que permite una mayor difusión, especialmente a nivel europeo.

E SIC tiene como propósito contribuir a la transformación del alumnado, para que se desenvuelva con éxito en su vida profesional de una forma responsable y anclada en valores éticos ejerciendo como actores de cambio en sus organizaciones y en su entorno social. De esta manera, ESIC realiza actividades de forma responsable para contri- buir a la sociedad, por lo que a través de su Departamento de Investigación y de su editorial se involucra en la publicación de esta tercera edición del infor- me La reutilización de datos , que refleja cómo nuestra sociedad se está trans - formando con la digitalización y, sobre todo, con el tratamiento de los datos. Nuestras áreas de formación comprenden títulos universitarios oficiales es - pecializados en Administración y Gestión Empresarial, Estrategia y Organi- zación, Marketing, Comunicación, Publicidad y Relaciones Públicas y Eco- nomía Digital; la oferta formativa de posgrado más amplia con másteres en Management, Marketing, Tecnología, Comercio y Negocios Internacionales, Comunicación y Publicidad, Recursos Humanos, Comercial y Ventas, Logísti- ca y Finanzas; y, especialmente, los MBA de ESIC, que están entre los mejo- res a nivel internacional y cuentan con la acreditación AMBA, solo al alcance de las más prestigiosas escuelas de negocios. Por otro lado, la unidad Corporate Education desarrolla formación a me- dida para empresas, adaptada a las necesidades de los equipos directivos y comerciales, para facilitar el reciclaje de conocimientos y aprendizaje de nuevas áreas de conocimiento. En línea con la digitalización de la sociedad, destaca nuestra formación online : másteres, programas superiores y cursos especializados que pueden cursarse desde cualquier parte del mundo con una mayor flexibilidad horaria. Asimismo, en ESIC impartimos los ciclos formativos de grado superior en las familias profesionales de Comercio y Marketing, Administración y Gestión, Informática y Comunicaciones e Imagen y Sonido. Además, más allá de la formación, ESIC contribuye a la sociedad con la di- fusión del conocimiento de los miembros de su comunidad. Para ello, ESIC cuenta con su propia editorial, ESIC Editorial, que constituye la proyección de ESIC en el mundo de las publicaciones, aportando la investigación y di- vulgación de temas de economía, empresa y marketing. Su fondo editorial, en constante renovación, cuenta con más de 800 títulos vivos, cuyos autores son principalmente profesores universitarios y profesionales, expertos co -

2.1 Presentación de ESIC

14

nocedores de nuestro entorno empresarial. Lleva más de 50 años editando libros profesionales sobre marketing, publicidad, ventas, recursos humanos, habilidades directivas, finanzas, estrategia, economía, matemáticas y esta - dística, que mezclan el rigor, la experiencia, la investigación y la amenidad. ESIC también cuenta con cuatro revistas científicas: ESIC Market, manage- ment y empresa ; aDResearch-ESIC , revista internacional de investigación en comunicación; Spanish Journal of Marketing-ESIC , especializada en marke- ting, y EDEIJ, ESIC Digital Economy and Innovation Journal , en el ámbito de la economía digital. Y, finalmente, mediante la Unidad de Desarrollo Profesional (UDP), ESIC abre las puertas al mundo a sus alumnos, quienes pueden disfrutar de la bolsa de empleo de por vida, y con el Departamento de Emprendedores pone en marcha ideas de negocio y proporciona asesoramiento.

En definitiva, ESIC y la sociedad juntos; comprometidos con la formación y la ética.

E ste informe es el resultado de la extensión y actualización de uno de los 24 proyectos seleccionados —de un conjunto muy amplio de propues- tas, un total de 1.839— en la segunda edición del Programa de Innovación Abierta (PIA) de la Fundación Cotec, lanzada el año 2017. Desde Cotec, nos congratula que el proyecto haya continuado con actualizaciones y mejo- ras de periodicidad bianual. La dimensión que están adquiriendo los datos abiertos en el mundo actual en un contexto de digitalización de la sociedad se ha visto acelerada por la pandemia de la COVID-19. Por ello, resulta clave entender cuál es su valor añadido y qué políticas se están llevando a cabo desde las Administraciones Públicas para su impulso, dado que una buena gestión de estos es crucial para maximizar su impacto. Cuando apostamos por este proyecto, lo hicimos porque encajaba perfec- tamente en la línea estratégica de Cotec, que pretende impulsar dos transi- ciones en España —la transición digital y la transición intangible—, además de la transición circular. España forma parte del grupo de países europeos con menor inversión en los activos característicos de la economía del cono- cimiento, los intangibles, y aunque en las dos últimas décadas ha presenta- do el mejor comportamiento dinámico de todas las economías europeas, llegando a recortar distancias hasta antes de la crisis de 2008, aún queda un largo recorrido para cerrar la brecha. No es casualidad que España, al ser una economía rezagada en inversión en intangibles, también forme parte del grupo de países europeos con unos niveles más limitados de productividad. En este contexto, donde cada vez se pone más el foco en el valor de los activos intangibles, el dato, como representación de estos, cotiza al alza ha- ciendo que su reutilización sea más valiosa y relevante que nunca. De aquí la gran importancia de proyectos como este, donde no solo se identifican

2.2 Presentación de COTEC

15

esideDatum Data Company, S.L. 1 , habitualmente referenciada simple- mente como «desideDatum», una empresa española especializada en la consultoría e implementación de proyectos relacionados con datos, ya sea en Administraciones Públicas como en organizaciones privadas. En concreto, desideDatum ofrece servicios relacionados con: • Gobernanza de datos. las limitaciones del modelo de datos abiertos de las Administraciones Pú- blicas españolas en lo relativo a la reutilización de datos, como el hecho de que un 80 % de los datos publicados no siguen ningún estándar in- ternacional (limitando las posibilidades de integrarlos con datos de otras procedencias), sino que también se proponen soluciones para superarlas (en el ejemplo anterior, la adopción de iniciativas de estandarización ágil para documentar los modelos de datos).

desideDatum d

2.3 Presentación de

• Apertura y compartición de datos. • Transparencia y rendición de cuentas. • Innovación pública.

En relación con el ámbito de la apertura de datos hay que destacar que desideDatum es actualmente la empresa con más referencias en España y la única empresa del mundo que tiene acuerdos de colaboración con las tres principales soluciones tecnológicas para abrir datos: Socrata, OpenDataSoft y CKAN. Muchas instituciones públicas han confiado en los servicios de des - ideDatum para la apertura de sus datos (consultoría y/o implementación), por ejemplo, actualmente —octubre 2021— desideDatum tiene abiertos más de 20 proyectos de apertura de datos, destacando los casos de: • Gobierno de Aragón

• Generalitat de Catalunya • Govern de les Illes Balears • Gobierno de Navarra • Gobierno de La Rioja • Generalitat Valenciana • SABA Aparcamientos, S.A.

Por otro lado, desideDatum siempre ha apoyado a iniciativas en pro de la apertura y compartición de datos, como es el caso de este estudio, y además, trabajadores de desideDatum son destacados activistas en esta materia y a menudo dan charlas al respecto. Para desideDatum la apertura de datos significa aumentar el importante valor que estos conllevan, es una forma de empoderar a la sociedad y de reactivar la economía gracias a los datos.

1 Para más información se sugiere consultar https://www.desidedatum.com/

16

17

Introducción

3

L os datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en la que aparecen, tal y como mantiene la Open Knowledge Foundation (2021). Por ello, son recursos estratégicos para los Gobiernos, las empresas y los ciudadanos (Walter, Lovett, Maher, Williamson, Prehn, Bodkin-Andrews y Lee, 2021). Disponer de datos abiertos ofrece la oportunidad de poder reutilizarlos para conseguir productos y servicios más innovadores y convenientes para los usuarios finales. Las organizaciones públicas y privadas, así como los ciu - dadanos han de tener la posibilidad de acceder a los datos de tal manera que puedan ser reutilizados para crear valor. Ferrer Sapena, Calabuig, Sán- chez Pérez y Vidal Cabo (2020), haciendo referencia al gobierno abierto, se- ñalan que la información debe estar bien estructurada «para que el esfuerzo público permita, mediante un adecuado reaprovechamiento, mejorar los servicios a los ciudadanos y ser al mismo tiempo fuente de creación de riqueza y de modernización del sector público» (p. 6). Cadena (2019) señala que, en la web de una organización, se ha de contar con información que pueda ser utilizada por las empresas y ciudadanos. Admite que la falta de la calidad de información publicada es una barrera para que el proceso de reutilización sea masivo. Los datos que se crean, almacenan, procesan, intercambian, comparten, agregan y reutilizan son de calidad siempre que sean útiles, es decir, se obtiene de ellos su valor espe- rado. Además, para garantizar la calidad de los datos en una organización, se requiere: 1) tener en cuenta las necesidades de los usuarios; 2) definir un proceso de generación de datos claros; 3) identificar el ciclo de vida de los datos; 4) nombrar a una persona que gestione los datos y 5) evaluar la calidad del producto de datos. Zuiderwijk, Pirannejad y Susha (2021) señalan, refiriéndose a mejores prác - ticas de gobierno abierto, que un factor crítico que caracteriza altos niveles de progreso es proporcionar facilidades para que los ciudadanos, las em- presas y los empresarios participen como partes interesadas clave en los proyectos de datos abiertos. La crisis de la COVID-19 ha modificado las rutinas de los ciudadanos. Al imponer cuarentenas, evitar encuentros presenciales y cerrar las oficinas públicas responsables de la recepción y procesamiento de documentos, la pandemia reveló lo problemático que es no simplificar y digitalizar ciertas

3.1 La importancia de los datos abiertos

18

interacciones del ciudadano con los Gobiernos (Cetina, 2021). La pandemia, a modo de ejemplo, ha evidenciado la importancia de tener datos dispo- nibles actualizados en tiempo real para la toma de decisiones sobre salud pública. Cetina (2021) destaca que, para reducir el impacto sanitario de la crisis, los datos son esenciales en el rastreo y pronóstico de la propagación de la COVID-19, en la orientación de la investigación científica, en la reali - zación de diagnósticos y en la búsqueda de tratamientos. Asimismo, desta- ca que, para analizar el impacto económico de la pandemia, los datos son cruciales para dirigir las ayudas económicas hacia quienes más las necesitan, para administrar las compras públicas de emergencia y, progresivamente, para comprender la relación entre salud pública, medidas de cuarentena y actividad económica. Además, como comenta Marc Garriga Portola, de desideDatum, muchos ciudadanos e incluso periodistas han descubierto los datos abiertos gracias a la COVID. El uso de datos abiertos —en los portales más maduros— ha aumentado sensiblemente gracias a la COVID, aunque después del tirón inicial ahora sigue un uso importante de datos abiertos sin que estos sean todos relacionados con la pandemia. Por ejemplo, los casos de los portales de la Generalitat de Catalunya y de la Junta de Castilla y León, que son dos de los más destacados al abrir datos sobre la COVID. El Índice de Economía y Sociedad Digital (Digital Economy and Society Index-DESI) se considera un indicador de la transformación digital en Eu - ropa y refleja su progresión en los países europeos en términos de com - petitividad. Este índice se compone de las siguientes dimensiones: conec - tividad, capital humano, uso de Internet, integración de tecnología digital y servicios públicos digitales (European Commission, 2020a). La evolución de estas dimensiones depende en gran medida de la calidad de los datos abiertos disponibles para ser reutilizados (Hrustek, Furjan y Pihir, 2021). No es casualidad que los países que puntúan más alto en madurez de datos abiertos también estén mejor posicionados en este índice, como es el caso de Irlanda, Holanda, España y Malta (European Commission, 2020b). El Portal Europeo de datos (https://data.europa.eu) trata de mejorar el ac - ceso a los datos abiertos desde cualquier país europeo y promover prác- ticas de publicación de datos a nivel regional, nacional e internacional. Desde 2015, y de forma anual, se presentan datos comparativos de la evo- lución y uso de datos abiertos en países europeos. Los resultados de estas comparativas se muestran en el tablero de datos abiertos, que constituye

3.2 Los datos abiertos en Europa

19

una herramienta muy práctica para comparar el nivel de madurez de los datos abiertos en los distintos países de la Unión Europea. Cecconi y Radu (2018) realizan una comparativa de mejores prácticas en Europa sobre la gestión de datos abiertos y destacan los casos de Irlanda, España y Fran- cia. La Comisión Europea (European Commission 2020b) ha actualizado este informe sobre Open Data Maturity, y se observa que Irlanda, España y Francia mantienen su posición dominante en gestión de datos abiertos, y al grupo se unen los casos de Dinamarca, Estonia, Polonia, y Austria. La metodología que utilizan Cecconi y Radu (2018) se ha ido mejorando a lo largo del tiempo para analizar el nivel de madurez de los datos abiertos en diferentes países considerando cuatro dimensiones que se explican a continuación: 1. Política de datos abiertos: Esta dimensión se centra en la presencia de políticas específicas y estrate - gias que fomentan los datos abiertos a nivel nacional. La dimensión eva- lúa las estructuras de gobernanza que permiten la participación de actores públicos y privados, así como la implantación de medidas que permitan iniciativas de datos abiertos a nivel nacional, regional y local. 2. Impacto de datos abiertos: La segunda dimensión evalúa el nivel de comprensión de los datos abiertos entre entidades del sector público, las actividades que se realizan para su- pervisar la reutilización y su impacto. Se centra en cinco áreas:

• Estrategia de medida y monitorización del impacto • Impacto político • Impacto social • Impacto medioambiental • Impacto económico.

3. Portal de datos abiertos: La tercera dimensión se centra en características avanzadas del portal que permite que los usuarios accedan a los datos abiertos y que se promocione la interacción entre publicadores y reutilizadores, por ejemplo, a través de comités de discusión. Además, la dimensión evalúa el uso que hacen los gestores de portales de herramientas analíticas para comprender mejor las necesidades de los usuarios y su comportamiento, y actualizar los portales en línea con la perspectiva de estos análisis. También se evalúa la cober- tura de datos abiertos en diferentes dominios, así como una aproximación y medida en el lugar, para asegurar la sostenibilidad del portal de datos abiertos. 4. Calidad de datos abiertos La cuarta dimensión se centra en las medidas que adoptan los gestores del portal para asegurar la alimentación sistemática de las fuentes de datos en el país. Vigila el grado de cumplimiento con el estándar de metadatos DCAT-AP e identifica hasta qué punto los datos y los metadatos están ac -

20

tualizados y son completos. Esta dimensión ofrece incentivos a los gestores de datos y a los que toman decisiones para que adopten mejores prácticas, incluidos los elementos de datos enlazados, tales como identificadores de recursos uniformes (URI).

De acuerdo con el último informe de madurez de datos abiertos (European Commission, 2020b), se puede afirmar que (Figura 1):

• Los países europeos son cada vez más maduros en todas las dimen- siones. La puntuación de madurez de los países se concentra más en el extremo superior del espectro de resultados. • La puntuación media de madurez de los datos abiertos de los 27 paí- ses de la UE es del 78 %, un aumento de 12 puntos porcentuales en comparación con 2019. • Dinamarca ocupa por primera vez el primer lugar en la evaluación de este año. Mientras que Irlanda, España y Francia mantienen su posi- ción de tendencia del año pasado. El grupo se extiende a Estonia, Po - lonia y Austria. • Muchos de los Estados miembros (18) de la UE-27 se sitúan por enci- ma de la media europea.

Figura 1. La evolución de las dimensiones de madurez de datos abiertos en Europa. Fuente: European Commission (2020b, p. 6)

0 % 10 % 20 % 30 % 40 % 50 % 60 % 70 % 80 % 90 % 100 %

2016

2017

2018

2019

2020

Política

Portal

Impacto

Calidad

EU Promedio

21

Figura 2. Las puntuaciones generales de madurez de los datos abiertos de la evaluación de 2020.

A continuación, en la Figura 2, se presentan las puntuaciones generales de madurez de los datos abiertos por países de acuerdo con el Informe de Madurez de Datos Abiertos 2020 (European Commission, 2020b).

Promedio EU27+

Promedio EU27

0 % 10 % 20 % 30 % 40 % 50 % 60 % 70 % 80 % 90 % 100 %

Fuente: European Commission (2020b, p. 6)

La Figura 3 muestra los clústeres que se obtienen de acuerdo con este ín- dice de madurez. Los países se agrupan de menor a mayor en el índice en cuatro categorías: establecidos, veloces, seguidores y principiantes. De forma que se obtienen las siguientes conclusiones: • Los países europeos muestran un gran aumento en sus niveles de ma- durez, lo que resulta en una concentración de países en el extremo superior del espectro de resultados. • El clúster que establece tendencias consta de siete países. Irlanda, Es- paña y Francia mantienen su posición destacada, y el grupo se amplía con Dinamarca, Estonia, Polonia y Austria. • El grupo de veloces consta de 13 países y es el grupo más grande de los cuatro grupos.

Figura 3. Grupos de países en cuanto al índice de madurez en datos abiertos (2020). Fuente: European Commission (2020b, p. 7)

CREADOR DE TENDEN- CIAS

SEGUIMIENTO RÁPIDO

SEGUIDOR

PRINCIPIANTE

DK

NL GR LT FI SI CY

UA

FR ES IR EE AT

PL DE

SE

CZ RO LU BE UK CH MD

SK

NO

PT

MT

HU

AZ GE

LI

IT

HR LV BG

100 % 90 %

80 %

70 %

60 %

50 %

40 %

30 %

20 % 10 %

0 %

22

La Figura 4 presenta el nivel medio de madurez de la EU-27 en cada una de las cuatro dimensiones, y se obtienen las siguientes conclusiones:

• La política es la dimensión de datos abiertos más madura, con una puntuación media del 85 %. • Los portales nacionales están cada vez más avanzados con una madu- rez media del 79 %. • La puntuación media del 76 % en calidad muestra que se han produ- cido grandes mejoras en cuanto a garantizar la calidad de los datos y metadatos. • El impacto es la dimensión de datos abiertos menos madura, con una puntuación media del 72 %. Esto reitera la necesidad de un enfoque estratégico para supervisar y medir la reutilización de datos abiertos y el impacto que genera.

Figura 4. Nivel medio de madurez de la EU-27 en cada una de las cuatro dimensiones. Fuente: European Commission (2020b, p. 7)

85 %

72 %

79 %

76 %

Política

Impacto

Portal

Calidad

Adicionalmente, el informe europeo (European Commission, 2020b) desta- ca otras tendencias que constituyen buenas oportunidades para el desarro- llo y la mejora de la gestión de datos abiertos en el contexto europeo: La pandemia COVID-19 ha hecho hincapié en la necesidad real de dispo- ner de datos. Este año, los países europeos muestran un gran aumento en sus niveles de madurez, lo cual indica que Europa ha tomado buena direc- ción con respecto a los objetivos fijados en relación con los datos abiertos y su puesta a disposición para que los ciudadanos puedan reutilizarlos. La necesidad de responder a la emergencia llevó a muchos países a comenzar a publicar datos y a desarrollar iniciativas para que los datos fueran más fá- ciles de acceder y comprender (European Commission, 2020b). A medida que maduran las propuestas de datos abiertos de los países eu- ropeos, su atención se ha desplazado de la cantidad de datos disponibles a garantizar también su calidad. Además, la calidad no se considera de forma aislada, sino como un factor de interoperabilidad en cuanto a la capacidad de colaborar dentro de los países y a través de las fronteras, facilitando el in- tercambio de datos entre los sistemas informáticos (European Commission, 2020b).

23

Según el barómetro de datos abiertos (Web Foundation, 2018), la interopera- bilidad de los datos entre Gobiernos y países permitiría una respuesta más coordinada y una toma de decisiones más precisa tanto a nivel global como nacional y local. A modo de ejemplo, Alamo, Reina, Mammarella y Abella (2020) señalan que el acceso y uso de datos abiertos en la lucha contra la COVID-19 se ha obstaculizado, puesto que se han considerado diferentes formatos de datos, criterios cambiantes y no uniformes para la medición, así como cambios continuos en estructura y ubicación de las bases de datos. (2020) también destacan que un ámbito donde se está evidenciando esta heterogeneidad es en el cálculo de la tasa de mortalidad del virus, la cual cambia con la multiplicidad de criterios para su registro y puesta a disposi- ción del público. Como afirma Worthy (2015), las reformas no solo dependen de los datos brutos de las autoridades. Se espera que una mezcla de intermediarios de datos privados y voluntarios innove para crear portales y aplicaciones fáciles de usar, aportando una interoperabilidad que permita a los usuarios com- binar diferentes datos y herramientas en nuevas formas. Otro aspecto relevante es la medición del impacto. Generar un impacto posi- tivo en la sociedad y la economía mediante la publicación de datos abiertos siempre ha sido el objetivo final del amplio esfuerzo plurianual en toda Euro - pa. Medir el impacto es una tarea compleja y todavía no existe un entendi - miento compartido de cómo hacerlo mejor. Muchos países europeos están realizando con éxito actividades para comprender y captar en qué medida se reutilizan los datos abiertos y cómo se crea valor mediante la interacción con comunidades de usuarios. La Comisión Europea tiene previsto basarse en ello, desarrollando un marco de impacto compartido en los próximos años. En el Informe Analítico 16 (European Commission, 2020c), se analizan al- gunas prácticas relevantes de países destacados en gestión de datos abier- tos, concretamente los casos de Chipre, Francia e Irlanda. Uno de los temas comunes que se destaca en este informe es el relativo a las políticas de datos abiertos de cada uno de estos tres países. Mantienen una legislación específica sobre datos abiertos y una estrategia clara. Para que la estrategia sea más tangible y viable, un plan de acción ayuda a esos países a seguir de cerca el progreso de las distintas medidas que deben adoptarse y a hacer que las partes responsables rindan cuentas de ellas. También existe la tendencia de que los portales nacionales se conviertan en una ventanilla única para los datos abiertos. Incluyendo no solo datos del sector público, sino también datos publicados por el sector privado que son valiosos para el público. Eventualmente, toda la información necesaria y útil con respecto a los datos abiertos, su publicación, reutilización, etc., debería estar disponible desde esta plataforma común.

Las características de los portales de datos abiertos nacionales van más allá de permitir simplemente a los usuarios encontrar conjuntos de datos dispo-

24

nibles. Hay un enfoque común en la interacción entre los editores de datos y los reutilizadores a través de foros de discusión, sistemas de retroalimenta- ción específicos de datos y sistemas de calificación. A través de ejemplos, los portales exponen valiosos casos de reutilización de datos abiertos. Los equipos nacionales de datos abiertos tienen como objetivo aumentar el impacto no solo fomentando, sino también supervisando y analizando la reutilización de los datos abiertos. Examinan los temas que figuran actual - mente en las noticias y tienen por objeto asegurar que los conjuntos de datos pertinentes se publiquen y reciban especial atención en el portal. Los usuarios finales también pueden ponerse en contacto proactivamente con el portal para solicitar conjuntos de datos. Las mejores prácticas sobre cada una de las dimensiones de madurez de los datos abiertos que se exploran en este informe pueden ser de gran benefi - cio para que todos los países de Europa y fuera de ella se inspiren, aprendan y apliquen para mejorar sus propias prácticas. En la última edición del informe del sector infomediario, realizada por ASE- DIE, se incluyen resultados sobre un análisis de 529 compañías que tienen modelos de negocio basados en datos (ASEDIE, 2021). El Observatorio Internacional de Telecomunicaciones y de la Sociedad de la Información (ONTSI) ha publicado informes sobre la caracterización del sector infome- diario desde 2011 hasta la actualidad (Red.es 2021). La iniciativa Aporta (https://datos.gob.es/es/blog-tags/iniciativa-aporta) también suministra in - formación sobre el estado actual del sector infomediario, productos y ser- vicios que ofrecen, y que constituyen elementos esenciales para la reutiliza- ción, así como en análisis de las características de la oferta de información, desde la consideración de los datos como materias primas hasta su trans- formación en productos y servicios útiles (Aporta, 2021). ASEDIE (2021) pone de manifiesto que la digitalización, los avances en in - teligencia artificial, el Internet de las cosas son realidades que evolucionan a un ritmo cada vez mayor y que están provocando una transformación en el sistema económico. Los datos, su gestión y análisis, se han convertido en el elemento necesario para el progreso empresarial, lo que convierte al sector infomediario en uno de los factores más influyentes de nuestra economía. En este mismo informe se destaca cómo el año 2020 ha supuesto avances y nuevos retos en materia de digitalización e inteligencia artificial, como con - secuencia derivada de la crisis provocada por la COVID-19, que ha puesto de manifiesto la importancia del progreso en estas materias para el creci - miento de la economía y de la sociedad (ASEDIE, 2021). Se reconoce además que hay una falta de «cultura del dato» consolidada no solo en la sociedad, sino en los distintos niveles de la Administración Pública. La falta de digitalización y la poca calidad de los datos son algunas

3.3 Los datos abiertos en España

25

de las barreras que dificultan el acceso y la reutilización de la información (ASEDIE, 2021).

Las empresas infomediarias son más activas en unas zonas que en otras en España. Destaca especialmente la Comunidad de Madrid, con el 38 % de las empresas infomediarias radicadas en esta comunidad autónoma. Un segundo grupo de tres comunidades autónomas (Cataluña, Andalucía y Co- munidad Valenciana), con pesos entre el 9 % y el 13 %, aglutinan al 32 % de las empresas infomediarias. Las doce comunidades autónomas restantes y la Ciudad Autónoma de Melilla congregan al 30 % de las empresas infome- diarias (ASEDIE, 2021). Del total de empresas infomediarias, un 40 % (281) fueron creadas en los úl- timos 10 años. El subsector que más empresas ha creado en dicho periodo ha sido el económico financiero, con 58 empresas. El que en proporción ha creado más empresas en los últimos 10 años ha sido el meteorológico, con un 60 %. La evolución del sector infomediario en su conjunto ha sido posi- tiva, con un crecimiento del 6,4 % por encima de la evolución del producto interior bruto, que ha sido del 3,4 % (ASEDIE, 2021). El 96 % de los encuestados afirman que reutilizan datos para crear sus pro - ductos o servicios de valor añadido. El 70 % de los encuestados afirman que también reutilizan los datos para uso interno, frente al 30 % que indican que el uso es exclusivamente externo. El 61 % de las empresas entrevista - das usan la inteligencia artificial para elaborar productos de valor añadido o crean productos que se basan en inteligencia artificial. El 100 % de las empresas entrevistadas afirman que la apertura de datos de manera estruc - turada incrementa el valor de la propia base de datos (ASEDIE, 2021). Las empresas infomediarias están de acuerdo en que la normalización de la información es importante y necesaria a todos los niveles (AGE, 17 comuni- dades autónomas, 52 provincias, EELL…). La homogeneización y la calidad se han convertido en un estándar. Se valora positivamente cualquier inicia- tiva que permita acceder a una información reglada y lo más estandarizada posible. A diferencia de los de años anteriores, todas las empresas entrevis- tadas afirman que un aumento de las bases de datos abiertas y el acceso a estas es determinante para una evolución positiva del sector, y más del 60 % lo consideran prioritario (ASEDIE, 2021). Las dos barreras principales con la que se encuentran las empresas a la hora de reutilizar información son la poca actualización de las bases de datos disponibles y el hecho de que la información únicamente esté disponible en algunas comunidades autónomas o ayuntamientos (ASEDIE, 2021). En este sentido, y en vías de mejorar estas dos barreras, hemos detectado un aumento significativo de datos federados con respecto a nuestro infor - me previo (Abella, Ortiz de Urbina Criado, De Pablos Heredero, Vidal Cabo y Ferrer Sapena, 2019). La federación de datos permite redistribuir un con-

26

junto de datos abiertos desde su dominio original u otro dominio en su totalidad o en parte. Es una manera de recoger fuentes externas de datos en dominios que habitualmente son visitados de forma más activa. La normativa también se considera un obstáculo relevante para la reutiliza- ción de datos. La falta de conocimiento a la hora de priorizar las normativas coexistentes, así como la confusión entre normativas a la hora de acceder a la información implica, en ocasiones, restricciones al acceso o incluso pro- híben literalmente su reutilización. Un ejemplo de esta confusión es la que genera la normativa de protección de datos, que está siendo interpretada de forma errónea, aplicándose no solo a personas físicas, sino también a ju- rídicas, bloqueando, por tanto, el acceso a esa información, lo que perjudica la transparencia empresarial (ASEDIE, 2021). En 2021 más del 60 % de los encuestados consideran que, tras tres años en vigor, la normativa de protección de datos tiene un impacto negativo en el desarrollo de su negocio, una afirmación que sigue creciendo en compara - ción con los años anteriores (57 % en 2020 y 53 % en 2019) (ASEDIE, 2021). El 88,24 % de los encuestados ha notado los efectos de la COVID-19 a lo lar- go del año 2020, que ha tenido como consecuencia el impulso a los proce- sos de digitalización, el incremento en el uso de los portales de datos abier- tos y el aumento de la demanda y apertura de nuevos conjuntos de datos, muchos de ellos relacionados con la COVID-19. Es importante mencionar que, en la priorización de los juegos de datos, el interés público de cada mo- mento tiene un papel relevante, por lo que en la actualidad cabe destacar el interés por las bases de datos relacionadas con la pandemia de la COVID-19 (sanidad, economía, trabajo, ayudas sociales, vacunación…) (ASEDIE, 2021). En el camino hacia la apertura de bases de datos, la principal barrera para 12 de las 17 comunidades autónomas es la falta de formación de los em- pleados públicos sobre los beneficios del open data : «Es necesario que se incentive una cultura de datos abiertos». La falta de cultura de datos abiertos provoca que en ocasiones «haya miedo a compartir y a la apertura de datos, los departamentos ven los datos como algo de su propiedad y cuesta que los compartan». La situación de los recursos humanos de la Administración se plantea como barrera también ante la imposibilidad de poder destinar recursos de forma permanente a la coordinación de la apertura de datos y ante la falta de personal con formación necesaria para ello (ASEDIE, 2021). La falta de digitalización es la siguiente barrera mencionada por 10 de las 17 comunidades autónomas, que han puesto de manifiesto que en ocasio - nes no se puede llevar a cabo la extracción de bases de datos por no en - contrarse digitalizadas. Para 9 de 17 comunidades autónomas la siguiente barrera a la que se enfrentan es la poca calidad de los datos, seguida de las barreras técnicas, mencionadas por 7 de las 17. Igualmente se destaca que la complejidad de las bases de datos es en numerosas ocasiones la excusa para no llevar a cabo la apertura (ASEDIE, 2021).

27

La aprobación en el año 2020 del IV Plan de Gobierno Abierto (Ministerio de Política Territorial y Función Pública, 2020) ha sido una oportunidad para preguntar en este informe de ASEDIE (2021) a los responsables de datos abiertos de las 17 comunidades autónomas los aspectos principales de los compromisos adquiridos por su comunidad en el marco de este plan. Estos compromisos se impulsarán e implementarán a lo largo de los años hasta el 2024, fecha hasta la que tiene proyección el IV Plan de Go- bierno. De las contestaciones se extraen tres aspectos principales: transparencia, datos abiertos y participación ciudadana. De las 17 comunidades autóno- mas, 8 de ellas han especificado que uno de los aspectos principales del compromiso adquirido tiene que ver con el incremento de la transparencia a través de diferentes mecanismos, como la elaboración de nuevas leyes o de planes estratégicos, facilitando la accesibilidad a los portales de trans- parencia, implantando sistemas de integridad y rendición de cuentas, etc. (ASEDIE, 2021). En cuanto a los datos abiertos, 7 de las 17 han especificado como com - promiso adquirido el impulso a la apertura de datos y su reutilización. La elaboración de estrategias de datos abiertos que tengan como objetivo la priorización de datos y las mejoras en interoperabilidad, el impulso a la ad- ministración digital, el fomento de la reutilización y la interacción con los agentes reutilizadores son los principales aspectos mencionados. De las 17 comunidades autónomas, cuatro de ellas han mencionado el impulso a la participación ciudadana, a través de programas de atención a la ciudadanía, involucrando a la sociedad en la mejora continua de los servicios públicos, etc. (ASEDIE, 2021). Cadena (2019) señala que en un portal web la calidad de los datos debe ser un proceso multidimensional que se inicia desde el momento que se digita- liza la información y considera los requisitos para su reutilización, según las siguientes dimensiones (Cadena, 2019): 1. «Exactitud, es decir, datos que representan correctamente la entidad o evento del mundo real. 2. Puntualidad, datos que representen la situación real y la agilidad en la publicación. 3. Consistencia, no contienen contradicciones. 4. Exhaustividad, incluyen todos los elementos de datos que representan a la entidad o evento. 5. Disponibilidad, accesibles ahora y con el tiempo. 6. Conformidad, siguen las normas aceptadas.

7. Credibilidad, son fuentes confiables. 8. Accesibilidad, son legibles por máquina. 9. Relevancia, cantidad adecuada de datos».

28

Page 1 Page 2 Page 3 Page 4 Page 5 Page 6 Page 7 Page 8 Page 9 Page 10 Page 11 Page 12 Page 13 Page 14 Page 15 Page 16 Page 17 Page 18 Page 19 Page 20 Page 21 Page 22 Page 23 Page 24 Page 25 Page 26 Page 27 Page 28 Page 29 Page 30 Page 31 Page 32 Page 33 Page 34 Page 35 Page 36 Page 37 Page 38 Page 39 Page 40 Page 41 Page 42 Page 43 Page 44 Page 45 Page 46 Page 47 Page 48 Page 49 Page 50 Page 51 Page 52 Page 53 Page 54 Page 55 Page 56 Page 57 Page 58 Page 59 Page 60 Page 61 Page 62 Page 63 Page 64 Page 65 Page 66 Page 67 Page 68 Page 69 Page 70 Page 71 Page 72 Page 73 Page 74 Page 75 Page 76 Page 77 Page 78 Page 79 Page 80 Page 81 Page 82 Page 83 Page 84 Page 85 Page 86 Page 87 Page 88 Page 89 Page 90 Page 91 Page 92

Made with FlippingBook - Online Brochure Maker