Reutilización de datos abiertos

Estudio seleccionado en el Programa de Innovación Abierta (PIA) 2016 de Cotec. Tiene como objetivo formular directrices y recomendaciones que ayuden a la generación de negocios y servicios innovadores

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Autores:

ALBERTO ABELLA MARTA ORTIZ-DE-URBINA CRIADO CARMEN DE PABLOS HEREDERO

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

La contribución del sector público a la economía del dato

Proyecto seleccionado dentro de la convocatoria 2016 del Programa de Innovación Abierta (PIA) de la Fundación Cotec para la Innovación

Este proyecto ha contado con el apoyo técnico del departamento de Economía de Cotec.

JULIO · 2017

ÍNDICE

1. RESUMEN EJECUTIVO

8

2. Introducción

11

2.1. España en el contexto europeo

11

2.2. El modelo de reutilización de datos

14

2.2.1. El proceso de publicación de datos

15

2.2.2. Los reutilizadores de datos

16

2.2.3. El impacto de los datos reutilizados

18

2.2.4. Modelos de negocio de datos abiertos en el contexto europeo 2.2.5. Consumo de datos en organizaciones reutilizando datos en el contexto europeo

19

22

2.3. Barreras a la reutilización a nivel europeo

22

2.4. Objetivo del informe

23

3. Metodología

24

3.1. Metodología de estudio de los portales que publican datos

24

3.1.1. Modelo simplificado de madurez de portales que publican datos

24

3.2. Metodología de estudio de los juegos de datos publicados

25

3.3. Metodología de estudio de la reutilización de los datos publicados

26

4. Diagnóstico

28

4.1. Diagnóstico de los portales que publican datos

28

4.1.1. Actualización de los datos y disponibilidad de API

28

4.1.2. Sistema de gestión de datos

28 29 29 30 30 30

4.1.3. Portal de servicios desarrollados

4.1.4. Madurez de los portales según la metodología

4.2. Diagnóstico de los juegos de datos publicados

4.2.1. Distribución por grado de madurez de los portales que los publican

4.2.2. Distribución según la madurez de los portales

4.2.3. Distribución por temáticas de la NTI-RISP

31

3

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

4.2.4. Categorización por el estándar técnico utilizado

32

4.2.5. Categorización por los mecanismos de acceso necesarios para el acceso a los datos

33

4.2.6. Categorización por el contenido geográfico

34

4.2.7. Categorización por la frecuencia de actualización

34

4.2.8. Categorización por reusabilidad global

35

4.3. Diagnóstico de la reutilización de datos

36

4.3.1. Análisis del conocimiento sobre las entidades que reutilizan datos publicados

36

4.3.2. Análisis reutilización de datos por sectores de actividad

37

4.3.3. Análisis reutilización de datos por ámbito territorial

39

4.3.4. Análisis de los tipos de innovación por la reutilización de datos abiertos 4.3.5. Análisis de la disponibilidad de registro de los accesos

39

40

4.3.6. Análisis de las actividades de promoción del uso de datos abiertos

40

4.4. Diagnóstico de los servicios generados

41

4.4.1. Análisis de las temáticas de los servicios

41

4.4.2. Análisis de sostenibilidad y modelos de negocio de los servicios

41

4.4.3. Análisis de los autores de los servicios

42

4.4.4. Análisis de otras características de los servicios

42

4.4.5. Análisis de la creación de valor de los servicios

42

5. Estimación cualitativa de servicios innovadores

44

5.1. Tipos de modelos de negocio identificados

44

5.1.1. Datos de los usuarios

44

5.1.2. Anuncios

44

5.1.3. Freemium

45

5.1.4. Recomendaciones contextuales

45

5.2. Otros mecanismos de sostenibilidad del uso de datos abiertos

45

5.3. Análisis de los servicios por el modelo de negocio

46

5.4. Comparativa de servicios generados vs datos disponibles

46

6. DAFO

47

7. Conclusiones

48

4

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

7.1. Principales barreras

48

7.2. Otras barreras

48

7.2.1. Barreras estratégicas

49

7.2.2. Barreras técnicas

49

7.3. Medidas para sobrepasar las barreras

49

7.3.1. Asociación de publicadores de datos

50

7.4. Futuras líneas de trabajo

51

7.4.1. Estudio de la innovación empresarial a partir de la reutilización de datos abiertos

51

7.4.2. Métricas de reutilización de datos

52

7.4.3. Estudio de las condiciones de generación de nuevos negocios desde las fuentes de datos

52

7.4.4. Actualización continua de los datos

52

8. Bibliografía

53

9. Anexos

55

9.1. Relación de portales de datos muestreados

55

9.2. Cuestionario a los reutilizadores

58

9.3. Respuesta sobre los tres usos más comunes que los reutilizadores dan a los datos de su portal

60

9.4. Respuestas a los tres juegos de datos que más se usan en su portal

62

9.5. Características básicas de un sistema de gestión de datos (DMS)

63

9.6. Clasificación de estándares técnicos según MELODA versión 4

65

5

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

ÍNDICE DE ILUSTRACIONES

Ilustración 1: Mercado de datos abiertos por sector para la EU28+ 2020 (en millones de euros)

11

Ilustración 2: Tamaño del mercado directo para la EU28+ 2020

12

Ilustración 3: Clasificación de países en función de la madurez de los datos abiertos en la EU28+

13

Ilustración 4: Madurez del uso de datos abiertos

14

Ilustración 5: Ecosistema de reutilización de datos abiertos

15

Ilustración 6: Categorías de reutilizadores

16

Ilustración 7: Modelo de creación de valor de la reutilización de datos

18

Ilustración 8: Clasificación mecanismos de impacto

18

Ilustración 9: Modelo conceptual para la generación de valor a partir de los datos abiertos públicos (Open Government Data) Ilustración 10: Arquetipos de modelos de negocio en la cadena de valor de los datos abiertos 20 Ilustración 11: Arquetipos de la cadena de valor de los datos abiertos por tipo entidad 21 Ilustración 12: Consumo de datos por temáticas en empresas reutilizando datos abiertos 22 Ilustración 13: Distribución de la madurez de portales de datos en España 29 Ilustración 14: Distribución de juegos de datos por madurez de los portales que los publican 30 Ilustración 15: Distribución de juegos de datos por temáticas NTI-RISP 31 Ilustración 16: Distribución de juegos de datos por el estándar de almacenamiento utilizado 32 Ilustración 17: Distribución de juegos de datos por el mecanismo de acceso utilizado 33 Ilustración 18: Distribución de juegos de datos por el contenido geográfico de la información 34 Ilustración 19: Juegos de datos por frecuencia de actualización 35 Ilustración 20: Distribución de juegos de datos muestreados por categorías reusabilidad MELODA 35 Ilustración 21: Distribución del conocimiento de los reutilizadores de datos 36 Ilustración 22: Distribución de autores de los servicios 42 19

6

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

ÍNDICE DE TABLAS

Métrica para analizar el grado de madurez de los portales de datos

25

Tabla 1:

Tabla 2 : Tabla de temáticas del muestreo de datos publicados

32

Tabla 3: Explicación del metadato asociado a un formato técnico

33

Tabla 4: Conocimiento del tipo de reutilizadores de datos

37

Tabla 5: Reutilizadores por sector de actividad

38

Tabla 6: Ámbito de actuación de los reutilizadores de datos abiertos

39

Tabla 7: Tipos de innovación por la reutilización de datos abiertos

40

Disponibilidad de los registros de acceso a los datos

40

Tabla 8:

Tabla 9: Actividades de promoción del uso de datos abiertos

41

Tabla 10: Creación de valor por la reutilización de los datos

43

Tabla 11: Análisis DAFO

47

7

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

1

RESUMEN EJECUTIVO

La progresiva digitalización de nuestras ciudades (ciudades inteligentes 1 ) y de los objetos que nos rodean (Internet de las Cosas 2 , objetos llevables 3 ) dibuja una sociedad donde el tratamiento masivo de los datos abre la puerta a una nueva era. Los datos abiertos , datos masivos o innovación basada en datos , se perfi- lan actualmente como las vías por las que la sociedad digitalizada resolverá desafíos basados en el conocimiento y la reutilización de datos. Desafíos anteriormente inabordables, como la sostenibilidad pública y medioambien- tal, el transporte, la salud o el empleo. Las instituciones públicas y las empresas generan importantes cantidades de datos abiertos 4 que pueden reutilizarse para crear valor en múltiples dimensiones: economía, sociedad, medio ambiente, etc. El sector público ha sido desde el comienzo de la economía de los datos un importante contribuidor, tanto en forma de regulación y normativa, como en forma de incentivos que proporcionan los cimientos de esta nueva econo- mía. Su papel más proactivo es la creciente publicación de datos abiertos. Con ellos, se busca el círculo virtuoso entre los datos publicados y, que, basados en ellos, se pueden lograr tres tipos de efectos: 1. Se incrementa la confianza en la gestión pública al estar disponibles los datos de la gestión. 2. Se incrementa la eficiencia mediante una utilización más fácil de los recursos públicos adecuados. 3. Se permite la aparición de nuevas aplicaciones y servicios que, con base en dichos datos y procesos que añaden valor, generan un impacto social y económico. La reutilización de los datos abiertos permite crear valor para la sociedad como consecuencia de la oferta de nuevos productos y servicios digitales y la dinamización de la actividad económica y empresarial. Entre otras cosas, la reutilización de datos ha permitido la creación de nuevas empresas que con pocos recursos propios llevan a cabo modelos de negocio basados en la elaboración de productos y servicios enriquecidos con información de valor añadido (Marcos-Martín y Soriano-Maldonado, 2011; Abella, Ortiz-de- Urbina-Criado y De-Pablos-Heredero, 2014). Sin embargo, en muchos casos, el sector público no tiene establecidas, o no es el objeto de su actividad, las rutinas organizativas que le permitan desarrollar la capacidad para extraer todo el valor de los datos abier- tos. Y es aquí donde las empresas pueden intervenir, creando servicios de valor añadido que hagan la información más comprensible y asequi- ble (Ferrer-Sapena, Peset y Aleixandre-Benavent, 2011; Lee y Kwak 2012; Abella et al. , 2014: 583).

1. Más de 80 sólo en España. 2. Más de 20.000 millones de acuerdo a los informes de Cisco para 2020. 3. Más de 600 millones, actualmente, volcando información de forma continua. 4. Los datos abiertos son aquellos que son publicados con una licencia que permite su reutilización para cualquier propósito y por cualquier persona o entidad con el único requisito de realizar la atribución de la fuente.

8

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Uno de los objetivos de este estudio es la formulación de directrices y reco- mendaciones que ayuden a la generación de negocios. Para ello, se han identificado los portales de datos abiertos en España y se ha analizado una muestra de los juegos de datos que tienen disponibles y de los servicios basados en ellos. Además, se ha enviado un cuestionario a los respon- sables de los portales para analizar algunas de las características de la reutilización de sus datos. En concreto, se ha hecho un diagnóstico sobre el conocimiento que tienen acerca de la reutilización de sus datos, sobre el tipo de innovación que se puede promover con ellos, sobre las activida- des de promoción del uso de datos, sobre los servicios generados y sobre la creación de valor en torno a la reutilización de los datos. Todos estos diag- nósticos han permitido realizar un análisis DAFO, a partir del cual se han incluido algunas reflexiones que pueden ayudar a construir futuras políticas públicas de gestión de datos. El estudio realizado nos permite poner de manifiesto las siguientes eviden- cias y reflexiones sobre el ecosistema de reutilización de datos en España: • BASE SÓLIDA. El sector público nacional se encuentra bien posicio- nado en el contexto europeo y mundial como publicador y promotor de la reutilización de datos (1er puesto en la UE), según el informe del portal paneuropeo de datos de 2016. • SECTOR AVANZADO DE PUBLICACIÓN DE DATOS. El sector, en gene- ral, podría calificarse como avanzado (74% de los datos publicados en portales con características avanzadas), si bien, entre fuentes, existen diferencias muy importantes en las facilidades ofrecidas para la reutilización de sus datos. • BASE NORMATIVA. En España existe una buena base normativa en cuanto a regulación de la reutilización de datos del sector público: adaptación de la directiva europea de 2013 (Ley 18/2015), la Norma Técnica de Interoperabilidad de Reutilización de recursos de la información (Resolución 19 de febrero de 2013) y otras normativas nacionales, regionales y locales. • CONSUMO INTERNO. Hoy por hoy, según los responsables de los portales de datos (el 44% reutilizan frecuentemente o siempre), los mayores consumidores de los datos publicados son las propias admi- nistraciones públicas, así como los mayores generadores de servicios (43%) y, en su opinión, las mayores mejoras por la reutilización de datos se producen para el sector público. • DESAJUSTE ENTRE DATOS PUBLICADOS Y SERVICIOS GENERADOS. La mayoría de los datos publicados (52%) no contiene ninguna refe- rencia geográfica y sólo el 13% incluye coordenadas y textos. Además, sus frecuencias de actualización son bajas (para el 95% su frecuen- cia de actualización es superior a una semana). Sin embargo, los servicios generados son mayoritariamente geolocalizados (72%) y en una parte significativa, en tiempo real (35%).

9 RESUMEN EJECUTIVO ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

• SOSTENIBILIDAD Y MODELOS DE NEGOCIO INCIPIENTES. Definiendo sostenibilidad como la viabilidad económica de un servicio a medio plazo se encuentra que un 50% de los servicios generados tienen esta característica. Sólo la mitad de ellos (25%) poseen un modelo de negocio independiente mientras que el resto (25%) cuentan con una entidad que sufraga los costes por diversos motivos (marketing, presencia institucional, etc.). • GOBERNANZA INTERNA DE DATOS. La actualización de datos es un atributo crítico para incrementar su valor. Las bajas frecuencias de actualización, y sus desajustes (entre lo anunciado y lo realmente publicado), son compatibles con la existencia de procesos manua- les de actualización y publicación, lo que supone una barrera para la generalización del uso de los datos. • COORDINACIÓN. No aparecen mecanismos que proporcionen una adecuada coordinación, tanto para la homogeneización de los datos publicados como para los estándares de acceso a las distintas fuen- tes. En este punto se identifica la necesidad de una entidad que aborde esta coordinación a nivel europeo. • FALTA DE CONOCIMIENTO SOBRE EL USO DE DATOS. La recopilación de información sobre la reutilización es limitada y el conocimiento que se da a los datos publicados y su impacto en la sociedad es muy limitado. • HERRAMIENTAS INADECUADAS. Un limitado uso de herramientas apropiadas (40% usan Sistemas de Gestión de Datos) está limitando el desarrollo de servicios (p. ej. falta de automatización del acceso). • FALTA DE ESTANDARIZACIÓN DE LOS MODELOS DE DATOS. Los datos publicados no comparten estructuras. Es decir, el mismo conjunto de datos, como, por ejemplo, los presupuestos, publicados por distintas entidades presentan frecuencias de publicación, niveles de agre- gación y contenidos distintos entre distintas fuentes. Nuevamente, resultan necesarios ciertos mecanismos para facilitar la homoge- neización, de forma que ésta dispersión no imponga barreras a la reutilización y, por tanto, a la generación de negocios.

10 RESUMEN EJECUTIVO ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

2

INTRODUCCIÓN

2.1.

ESPAÑA EN EL CONTEXTO EUROPEO

Berends et al. (2017) han realizado un estudio para cuantificar el valor que se puede crear en la EU28+ a través de los datos abiertos. Entre los indica- dores del valor creado por los datos abiertos que identifican se encuentra la cuota de mercado como porcentaje del PIB. Se estima que esta cifra es el 0,39% en 2017 y que alcanzará el 0,47% en 2020. Por otra parte, si se ana- liza el tamaño del mercado por sector, se observa que es la Administración Pública el sector que obtiene un mayor beneficio de la apertura de datos, siendo además los primeros y más importantes reutilizadores de estos datos (Berends et al., 2017) (Ilustración 1).

Ilustración 1 Mercado de datos abiertos por sector para la EU28+ 2020 (Cifras en millones de euros)

∞ | Fuente: Berends et al., 2017

En cuanto a la creación de empleo, Berends et al. (2017) estiman que, a partir de la reutilización de datos abiertos, en 2017 se van a crear 80.500 empleos y se espera que, en 2020, haya aumentado en un 36,9%, es decir, 25.000 empleos más. Por otra parte, se observa también un efecto de los datos abiertos en el ahorro de costes en las Administraciones Públicas. Berends et al . (2017) estiman que, en el 2020, el ahorro que se puede lograr en EU28+ puede alcanzar los 1.700 millones de euros.

11

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Por otra parte, según el estudio de Berends et al. (2017: 18-19) se espera que en el 2017 el tamaño del mercado directo de datos abiertos en la UE28+ sea de 59,7 miles de millones de euros, creciendo este tamaño un 36,9% entre 2016 y 2020, y llegando a alcanzar la cifra de 75,7 miles de millones euros en 2020. Si consideramos el tamaño total acumulado de este mer- cado incluyendo los efectos directos, 325 miles de millones, y los indirectos, las estimaciones oscilan entre 1.138 y 1.229 miles de millones euros. Sin embargo, el tamaño del mercado es diferente según el país. En países como Francia, Alemania, España y Reino Unido este mercado es muy importante (Ilustración 2).

Ilustración 2 Tamaño del mercado directo para la EU28+ 2020

Clasificación

< € 0,5 bn

€ 0,5 - 5 bn

> € 5 bn

∞ | Fuente: Berends et al. (2017: 19)

Según el informe del portal paneuropeo de datos (Carrara et al., 2016), España es líder en cuanto a sus políticas de apertura de datos, por delante de Holanda y Francia, (2º y 3º respectivamente). También es líder en cuanto al impacto, en este caso por delante de Eslovaquia y Francia (2º y 3º) y se posiciona tercero en cuanto a la madurez de sus portales de datos, por detrás de Luxemburgo y Francia (1º y 2º). La clasificación global puede verse representada en la ilustración 4.

12 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Carrara et al. (2016) analizan la madurez de los portales de datos abier- tos para cada país de la EU28+. Los resultados obtenidos permitieron clasificar en cuatro grupos a los países estudiados (Ilustración 3). Se observó que tres países se situaban en la etapa inicial ( Principiantes ), 12 eran Seguidores , ocho estaban en la etapa de crecimiento rápido (Avanzados) y otros ocho en la etapa más avanzada, los Líderes . En este último grupo está España, que es la que tiene la cifra más alta de madurez (91,4%), seguida de Francia (85,8%), Irlanda (79,9%), Holanda (78,7%) y Austria (78,0%).

ES

FR

UK IE

NL

AT

EL

BG FI

SK

NO RO

HR

PL

SI

CZ CY

LU

IT

SE

EE

CH

DE

HU

PT DK BE

Ilustración 3:

LT

Clasificación de países en función de la madurez de los Datos Abiertos en la EU28+

MT LV

LI

∞ | Fuente: Carrara et al. (2016: 59)

MADUREZ DEL PORTAL

Además, según el informe del portal paneuropeo de datos (Carrara et al. , 2016), si se desagrega la información para la valoración por países, se puede decir que España es líder en cuanto a sus políticas de apertura de datos (725 puntos sobre 790) por delante de Holanda y Francia, (2º y 3º), tam- bién es líder en cuanto al impacto (280 puntos sobre 300), en este caso por delante de Eslovaquia y Francia (2º y 3º) y es cuarta en cuanto a la madurez de sus portales de datos (220 sobre 250 puntos), por detrás de Luxemburgo, Francia y Estonia (1º, 2º y 3º). Si se considera la suma de todas las puntua- ciones obtenidas, España se sitúa la primera en el ranking con un total de 1.225 puntos sobre 1.340 5 . La clasificación global puede verse representada en la ilustración 4.

5. Disponible en http://www.europeandataportal.eu/ en/dashboard#tab-detailed

13 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Ilustración 4 Madurez del uso de datos abiertos

PRINCIPIANTES

SEGUIDORES

AVANZADOS

LÍDERES

∞ | Fuente: Carrara et al., 2016: 61

2.2.

EL MODELO DE REUTILIZACIÓN DE DATOS

La ilustración 5 muestra un modelo de reutilización de datos abiertos. En este modelo se identifican, en primer lugar, los portales de datos, que son los recursos que ponen a disposición de la sociedad los datos abiertos. En segundo lugar hay un ecosistema de agentes reutilizadores (explicados en el siguiente apartado) y en último lugar está la sociedad, entendiendo como tal todas aquellas personas, entidades y organizaciones que disfrutan de servicios basados en datos abiertos, bien sea de forma directa o indirecta. En este sentido, la publicación de los datos se puede realizar de dos for- mas en función de su frecuencia de actualización. Los juegos de datos, que son grupos de datos estructurados recuperables en un enlace o instrucción única en su conjunto a una entidad única, con frecuencia de actualización mayor que una vez por minuto. Y de los chorros de datos (dataJets), que son grupos de datos estructurados recuperables en un enlace o instrucción única en su conjunto a una entidad única, con frecuencia de actualización menor que una vez por minuto.

14 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

A C T I V O S DIGITALES EXTERNOS

PROCESOS DE VALOR AÑADIDO

ACTIVOS DIGITALES

SERVICIOS OFRECIDOS

Ilustración 5: Ecosistema de reutilización de datos abiertos

PORTAL DE DATOS

ECOSISTEMA

SOCIEDAD

DEMANDA DATOS CORRECCIÓN DATOS

DEMANDA SERVICIOS

∞ | Fuente: Traducido y adaptado

de Abella, Ortiz-de-Urbina-Criado y De-Pablos-Heredero (2015)

2.2.1.

El proceso de publicación de datos

La publicación de datos abiertos se realiza siguiendo un proceso con varias etapas: 1. Estrategia y diagnóstico. En esta etapa se toma la decisión estraté- gica de contribuir con datos abiertos a la sociedad. 2. Preparación de los datos. En esta etapa han de prepararse una conexión lo más automatizada posible entre los sistemas internos que generan la información y los datos a publicar. También ha de tomarse la decisión de sobre qué datos publicar y, en consecuencia, se ponen en marcha los cambios organizativos que soporten la publi- cación continuada de datos. 3. Publicación de datos. En esta etapa se utiliza un recurso técnico (portal de datos) que los pone a disposición del público, incluyendo para su operación la organización y normativa que se ha desarrollado en la etapa anterior. 4. Difusión. El consumo de datos no se produce de forma espontá- nea, por lo que los publicadores de datos deben realizar actividades para que sus datos sean conocidos y utilizados por la sociedad, que genera valor añadido una vez incluidos en alguna solución o servicio. 5. Evaluación. En esta etapa se debe contrastar la demanda de los datos con las expectativas y analizar la retroalimentación de los reu- tilizadores, de forma que se revise las prioridades de publicación, los mecanismos técnicos y, en general, todo el esquema de publicación. Cualquier deficiencia en estas etapas puede impactar de forma considerable, bien en el ritmo de publicación, bien en la reutilización efectiva de los datos.

15 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

2.2.2.

Los reutilizadores de datos

Los datos publicados en los portales pueden ser utilizados por diferentes agentes para crear productos o servicios para la sociedad. De esta forma, para poder analizar la reutilización de los datos abiertos hay que identificar a los agentes de este ecosistema, es decir, a los reutilizadores . Abella et al. (2017a) propone la siguiente clasificación de reutilizadores (Ilustración 6):

REUTILIZACIÓN EN PROPIO PUBLICADOR 5

REUTILIZADOR SOCIAL 3

USUARIO SOCIAL 8

CIUDADANO 1

DATO ABIERTO PUBLICADO

REUTILIZADOR PROFESIONAL 2

USUARIO PROFESIONAL 7

OTROS USUARIOS PÚBLICOS 6

REUTILIZADOR ACADÉMICO 8

Ilustración 6: Categorías de reutilizadores

REUTILIZADORES DIRECTOS

USUARIOS FINALES

∞ | Fuente: Traducido de Abella et al. , 2017a:7

USUARIOS INTERNOS

USUARIOS EXTERNOS

La ilustración 6 representa el proceso de publicación y reutilización de datos por los distintos tipos de usuarios. Desde la fuente original (Open data publicado en la ilustración 6), los primeros reutilizadores son las enti- dades que publican la información (5 en la ilustración) y otras relacionadas (6 en la misma ilustración). Tras esto los reutilizadores directos (2 y 3 en la ilustración) toman los datos y generan servicios que consumen, preferen- temente, los usuarios finales (1, 7 y 8 en la ilustración). Los reutilizadores académicos (4 en la ilustración) son un tipo especial que con frecuencia acuden a las fuentes de manera directa, como también hacen algunos de los ciudadanos (1 en la ilustración).

16 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Los reutilizadores o usuarios internos, son aquellos que se encuentran, bien en el interior de las organizaciones que los publican o bien en organiza- ciones afines. Se corresponden fundamentalmente con el elemento portal de datos en la Ilustración 5: Ecosistema de reutilización de datos abiertos. Existen dos grupos: • La propia organización que publica los datos (otras áreas o depar- tamentos). • Otras entidades públicas distintas de la que publica los datos Los reutilizadores directos son aquellas organizaciones que generan los ser- vicios y aplicaciones basados en los datos (y en otras fuentes o procesos que los enriquecen) y, en general, no son consumidores finales de los mis- mos. Se corresponden fundamentalmente con el elemento ecosistema en la Ilustración 5: Ecosistema de reutilización de datos abiertos. Hay dos tipos: • Reutilizadores profesionales con ánimo de lucro (infomediarios, incluyendo también a desarrolladores individuales establecidos con ánimo de lucro). • Reutilizadores profesionales sin ánimo de lucro (ONG, fundaciones, desarrolladores individuales sin ánimo de lucro, desarrolladores pre- vios al lanzamiento de empresas y otras iniciativas sociales). Finalmente, los reutilizadores indirectos son aquellos que consumen los datos en forma de servicios y aplicaciones, en algunos casos sin ser conscientes de ello. Se corresponden fundamentalmente con el elemento sociedad en la Ilustración 5: Ecosistema de reutilización de datos abiertos. Hay 4 tipos: • Ciudadanos individuales. • Investigadores y personal académico (incluidos estudiantes). • Usuarios sociales, provenientes de organizaciones sin ánimo de lucro. • Usuarios profesionales, provenientes de entidades con ánimo de lucro.

17 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

2.2.3.

El impacto de los datos reutilizados

El último paso es analizar el impacto que tiene la reutilización de los datos abiertos. Abella et al. (2017b) proponen un modelo de análisis del impacto de la reutilización de los datos abiertos (Ilustración 7). Los portales de datos son los que publican los juegos de datos a partir de los cuales se puede analizar el grado de reutilización de la información y su valor. La reutilización de estos datos permite crear productos y servicios innovadores, por ejemplo, aplicaciones para el ciudadano o para las empresas, cuya dis- tribución y/o comercialización puede tener un impacto económico y social. Sin embargo, Abella et al. (2017b) señalan que todavía hay un bajo nivel de evidencias empíricas basada en datos reales del mercado que analice este impacto económico y social, con notables excepciones como los trabajos realizados por Red.es (Red.es 2011, 2012, 2015 y 2017).

GRADO DE REUSABILIDAD

VALOR ECONÓMICO Y SOCIAL

VALOR DE REUSO

Ilustración 7: Modelo de creación de valor de la reutilización de datos

DISTRIBUCIÓN Y/O COMERCIALIZACIÓN DE PRODUCTOS/SERVICIOS

DESARROLLO DE PRODUCTOS/SERVICIOS

DATOS ABIERTOS

ETAPA 1

ETAPA 2

ETAPA 3

∞ | Fuente: Traducido de Abella et al. , 2017b:50

JUEGOS DE DATOS DE SMART CITIES

VALOR SOCIAL Y DE MERCADO

DESARROLLO APPS

En este sentido, uno de los problemas puede estar en la falta de infor- mación que tienen los portales de datos sobre la reutilización que se está haciendo de sus datos (Ver ilustración 21 en página 36 ). El portal paneuropeo de datos propone una clasificación del impacto según se describe en la Ilustración 8.

Ilustración 8: Clasificación mecanismos de impacto

ECONOMÍA

∞ | Fuente: Carrara et al ., 2015 Traducción

18 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

En este informe se dividen los efectos de los datos abiertos en tres dimen- siones principales. Rendimiento (performance). Evalúa los cambios en la eficiencia y calidad de los servicios gracias a la gestión del área de gestión de datos. Economía. Evalúa el impacto de la apertura de datos y de las innovaciones que se pueden generar basados en ellos. Social. Evalúa el impacto por la mejora de la transparencia y la rendición de cuentas. Los dos últimos aspectos de impacto económico y social han sido así mismo evaluados de forma cuantitativa y cualitativa por (Jetzek et al., 2014a,b). Estos autores proponen un modelo de factores para evaluar el impacto eco- nómico y social de la reutilización de datos que se dibuja en la ilustración 9.

FACTORES FACILITADORES

MECANISMOS PARA GENERAR VALOR

IMPACTOS

APERTURA

EFICIENCIA

H1

H5

ADMINISTRACIÓN DE LOS RECURSOS

INNOVACIÓN

H2

H6

VALOR ECONÓMICO Y SOCIAL

H3

H7

Ilustración 9: Modelo conceptual para la generación de valor a partir de los datos abiertos públicos (Open Government Data)

CAPACIDADES

TRANSPARENCIA

CONECTIVIDAD TÉCNICA

PARTICIPACIÓN

H4

H8

∞ | Fuente: Jetzek et al. , 2013:5

En este modelo una serie de factores habilitadores influyen sobre los cuatro mecanismos identificados de generación de valor: aumento de la eficiencia, innovación, transparencia y participación ciudadana).

2.2.4.

Modelos de negocio de datos abiertos en el contexto europeo

El estudio de Berends et al. (2017) describe 5 arquetipos de modelo de nego- cio en la cadena de valor de los datos abiertos, basado en los identificados en el estudio de Dekers et al. (2006), según se visualiza en la ilustración 10. Estos arquetipos se corresponden con distintas formas de creación de valor a lo largo de la cadena de valor de los datos abiertos. Los facilitadores (enablers) permiten y/o facilitan el acceso a los datos en cualquiera de las etapas de la cadena, y en general, no usan los datos ellos mismos.

19 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Un ejemplo de este modelo es Libreborme.net (http://libreborme.net), una iniciativa para poner al alcance de los usuarios los datos del registro mercan- til, que de otra manera, aunque son púbicos hay que pagar para obtenerlos. Los proveedores ( suppliers ) generan datos para que sean consumidos en etapas posteriores. En esta categoría podrían encontrarse cualquiera de los portales de datos abiertos a nivel nacional y en concreto cualquiera de los que se encuentran en el punto 9.1. Los agregadores ( aggregators ) acumulan datos y pueden permitir el filtrado o selección de los mismos, así como la mezcla proveniente de múltiples fuentes y la extracción de valor desde su análisis. Un ejemplo de este modelo sería Datary , (http://www.datary.io). Ésta proporciona que proporciona servicios de comercialización de datos en empresas que poseyendo los datos, realizan una baja explotación de los mismos.Los enriquecedores ( enrichers ) utilizan los datos para añadir valor a productos o servicios existentes. Un ejemplo de este tipo sería BBVA Data & Analytics (https://www.bbvadata.com) , la cual focaliza en la mejora de los procesos internos y la realización de análisis de datos. Finalmente, los desarrolladores utilizan los datos abiertos fundamentalmente para gene- rar aplicaciones o servicios. En este último grupo podría ubicarse a Moovit (http://moovitapp.com), que genera un servicio de movilidad urbana en ciudades de todo el mundo. No obstante, hay que destacar que pocas orga- nizaciones tienen un modelo de negocio ‘puro’ en el sentido que ocupen solo un eslabón de esta cadena de valor y que, lo más habitual, es que aborden varios simultáneamente.

DATOS ð INFORMACIÓN ð CONOCIMIENTO ð SERVICIOS ð VALOR AÑADIDO

FACILITADORES

Ilustración 10: Arquetipos de modelos de negocio en la cadena de valor de los datos abiertos

PRODUCTOS Y SERVICIOS DE DATOS

CREACIÓN DE DATOS

AGREGADOR DE DATOS

ANÁLISIS DE DATOS

DESARROLLADORES / ENRIQUECEDORES

PROVEEDORES

AGREGADORES

∞ | Fuente: Berends et al. , 2017:18

20 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

El muestreo del estudio de Berends et al. (2017) divide en tres sectores (privado, público y tercer sector, que incluye ONGs y entidades sin ánimo de lucro) a los utilizadores de datos y cualifica su papel en la cadena de valor de los datos abiertos. Los resultados se muestran en la ilustración 11.

ARQUETIPOS [SECTOR PÚBLICO]

18%

20%

14%

36%

12%

ARQUETIPOS [SECTOR PRIVADO]

21%

26%

19%

21%

13%

ARQUETIPOS [TERCER SECTOR]

AGREGADOR DE DATOS PROVEEDOR DE DATOS DESARROLLADOR ENRIQUECEDOR DE DATOS FACILITADOR DE DATOS

14%

26%

20%

Ilustración 11: Arquetipos de la cadena de valor de los datos abiertos por tipo entidad ∞ | Fuente: Traducida y adaptada de Berends et al. (2017:50)

20%

20%

21 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

2.2.5.

Consumo de datos en organizaciones reutilizando datos en el contexto europeo

Berends et al. (2017) presentan otros resultados (ilustración 12) de un análisis de 76 organizaciones, fundamentalmente del ámbito privado, que reutilizan datos. En la gráfica se muestra el tipo de datos que consumen para su actividad desglosado por temáticas de acuerdo a la clasificación Eurovoc, acorde a la norma europea DCAT-AP. Los resultados se presentan en la ilustración 12.

OTROS CIENCIA Y TECNOLOGÍA POBLACIÓN Y SOCIEDAD SALUD EDUCACIÓN, CULTURA Y DEPORTE MEDIOAMBIENTE JUSTICIA, SISTEMA LEGAL Y SEGURIDAD PÚBLICA ADMINISTRACIÓN Y SECTOR PÚBLICO ASUNTOS INTERNACIONALES ECONOMÍA Y FINANZAS TRANSPORTE REGIONES Y CIUDADES ENERGÍA AGRICULTURA, PESCA, CIENCIAS FORESTALES Y ALIMENTACIÓN

1,8%

7,1%

9,5%

4,2%

7,7%

8,9%

4,2%

11,9%

3,6%

11,6%

8,6%

10,1%

4,8%

6,0%

0% 2% 4% 6% 8% 10% 12% 14% VECES MENCIONADO

Ilustración 12: Consumo de datos por temáticas en empresas reutilizando datos abiertos

∞ | Fuente: Berends et al. , (2017:52)

2.3.

BARRERAS A LA REUTILIZACIÓN A NIVEL EUROPEO

Estudios previos, como el proyecto europeo LAPSI II sobre la reutilización de datos del sector público (2015), han analizado las barreras legales y políticas a eliminar para fomentar la reutilización de información del sector público. Este estudio ofrece una serie de recomendaciones para aumentar la reutilización de los datos del sector público: • Garantizar el mayor acceso posible a los recursos que proporcionan los datos. • Limitar las restricciones a lo que se puede hacer con los datos. • Proporcionar seguridad jurídica sobre los usos que se pueden hacer.

22 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

• Respetar la preferencia del usuario con respecto a, por ejemplo, el formato de los datos. • Ayuda a reducir los costes de búsqueda. • Dar a los reutilizadores voz en la toma de decisiones sobre cómo se liberan los datos. También se ofrecen recomendaciones para el establecimiento de polí- ticas como: • Promocionar los derechos de acceso que incluyan la posibilidad de reutilización de la información en los estados miembros de la UE. • Establecer la reutilización como un estándar en el marco europeo de interoperabilidad y las políticas de e-gobierno. • Incluir una mayor compresión y desarrollo del impacto del sector reutilizador en las legislaciones nacionales. • Desarrollar y adoptar medidas preventivas para la protección de datos. Teniendo en cuenta lo anterior, este informe realiza un estudio sobre la reutilización de datos en España con el objetivo de presentar el estado de la cuestión y de identificar directrices y recomendaciones que ayuden a fomentar el uso de los datos y a la generación de negocios. Para ello, se han identificado los portales de datos abiertos en España, se ha analizado una muestra de los juegos de datos que publican y se han analizado algunos de los servicios generados. Además, se ha realizado un cuestionario a los responsables de los portales para analizar algunas de las características y actividades en relación con sus datos abiertos. En concreto, se ha reali- zado un diagnóstico sobre conocimiento que tienen los portales sobre los reutilizados de datos, sobre el tipo de innovación que se puede realizar con estos datos, sobre las actividades de promoción del uso de datos, sobre los servicios generados y sobre la creación de valor de la reutilización de los datos. Todos estos análisis han permitido, por medio de un análisis DAFO, realizar un diagnóstico de las oportunidades y amenazas, y de las fortalezas y debilidades a partir del cual se han incluido algunas reflexiones que pue- den ayudar a construir futuras políticas de gestión de datos para el fomento de la creación de negocios.

2.4.

OBJETIVO DEL INFORME

23 INTRODUCCIÓN ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

3

METODOLOGÍA

3.1.

METODOLOGÍA DE ESTUDIO DE LOS PORTALES QUE PUBLICAN DATOS

De la totalidad de portales de datos (153) que están operativos en http://mapa.datos.gob.es, se han identificado 103 portales que publican datos abiertos (ver anexo 9.1). Este portal agrega juegos de datos a nivel nacio- nal y está impulsado por la iniciativa Aporta perteneciente a los Ministerios de Hacienda y Función Pública, y de Energía, Turismo y Agenda Digital 6 .

Para cada portal se identificaron los siguientes valores:

• Disponibilidad de mecanismos de publicación de las actualizaciones de datos. • Disponibilidad de un catálogo de recursos, número de juegos de datos disponibles y si el catálogo es descargable.

• Existencia de mecanismos de conexión directa con los datos (API).

• Disponibilidad de un portal donde se identifiquen servicios basados en los datos de los portales y número de servicios identificados. • Utilización de una herramienta específica de publicación y reutili- zación de datos: sistema de gestión de datos o por sus términos ingleses DMS (ver anexo). 9.5.-Características básicas de un sistema de gestión de datos (DMS).

• Número de juegos de datos publicados.

Se ha definido un modelo de madurez, simplificado a partir del modelo defi- nido por la iniciativa del portal paneuropeo de datos de Carrara et al. (2016), introduciendo los siguientes elementos a considerar:

3.1.1. Modelo simplificado de madurez de portales que publican datos

• La población de juegos de datos que supere los 30 elementos.

• La disponibilidad de una fuente (canal sindicación rss o equivalente) con las actualizaciones de los datos. • La disponibilidad de un interfaz de programación de aplicaciones (API) que permita el acceso automatizado a los datos por parte de usuarios externos. • La utilización de un sistema de gestión de datos (DMS). A efectos de este trabajo, se han considerado las siguientes herramientas: DMS, CKAN, Socrata, DKAN y ESRI open data. • La disponibilidad de un portal de aplicaciones con los servicios desa- rrollados basados en los datos publicados.

6. http://aporta.es

24

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Con la información obtenida, se ha realizado un análisis de la madurez de los datos de los portales. Para ello, se ha desarrollado una métrica a partir de la propuesta de Carrara et al. (2016). La categorización de los resultados sigue el mismo grupo de categorías que la métrica de reutilización de datos MELODA (Abella et al., 2014). Los aspectos analizados y su importancia se presentan en la tabla 1.

CONCEPTO INFORME EUROPEO PESO

CONCEPTO

Tener más de 30 juegos de datos

Difusión de los datos

20%

Tener una fuente con actualizaciones del catálogo

Usabilidad del portal

10%

Utilizar un sistema de gestión de datos (DMS)

Usabilidad del portal

15%

Tabla 1: Métrica para analizar el grado de madurez de los portales de datos

Disponibilidad de un interfaz de programación de aplicaciones (API) para interacción automatizada con los juegos de datos Portal de aplicaciones / servicios basados en datos abiertos

Reutilización de los datos

25%

Reutilización de los datos

30%

∞ | Fuente: Elaboración propia

a partir de Carrara et al. , 2016

3.2.

METODOLOGÍA DE ESTUDIO DE LOS JUEGOS DE DATOS PUBLICADOS

Para el muestreo de los juegos de datos de los portales, se intentó la auto- matización de la descarga de datos desde los portales. Tras evaluar varias posibles alternativas (parte manual, parte automática) se determinó que no se disponía de recursos suficientes para que la automatización pro- porcionara suficientes resultados (más del 60% de los portales no tenían propiamente un sistema de gestión de datos DMS) por lo que un muestreo automatizado solo proporcionaría un número de datos interesante en el 40% de los casos. Por otra parte, la extensión a otros gestores de portales utilizados (CMS) era todavía más compleja por la mayor dispersión de herramientas utilizadas. Por tanto, el muestreo ha tenido que realizarse de forma manual. En los 103 portales seleccionados se han identificado un total de 20.026 juegos de datos tras realizar un filtrado de los datos federados 7 entre porta- les, que de no filtrarse serían contabilizados en más de una ocasión. Como ejemplo, la web datos.gob.es tiene más de 14.000 juegos de datos listados, si bien aquellos que no están federados de otras fuentes suman 1.200. De igual manera, el portal de la Comunidad de Murcia tiene cinco juegos de datos que no pertenecen a otras entidades y que no han sido contabilizados doble- mente. Teniendo en cuenta la amplitud de la población objeto de estudio, se ha realizado un muestreo de 103 juegos de datos. De acuerdo con la herra- mienta Surveysoftware (http://www.surveysoftware.net/sscalce.htm) se ha seleccionado una muestra estadísticamente representativa de la población con un intervalo de 10 puntos al 95% de confianza.

7. Es un sistema múltiple de base de datos, en el cual, cada nodo en la federación mantiene su autonomía en los datos y define un conjunto de esquemas de exportación, a través de los cuales se hacen disponibles los datos a otros nodos.

25 METODOLOGÍA ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Para cada juego de datos, se ha identificado la temática de acuerdo a la norma NTI-RISP (Resolución 19 de febrero 2013), así como cada una de las dimensiones de reusabilidad de datos descritas en la métrica MELODA (Abella et al. , 2014) 8 : • Licencia de reutilización. • Estándar técnico en el que se presenta la información. • Mecanismos de acceso. • Modelo de datos utilizado. • Contenido geográfico de la información. • Frecuencia de actualización. • Además del nombre del juego de datos y la URL de acceso. Se ha realizado una encuesta a los portales de datos abiertos durante el mes de marzo y principios de abril del 2017 (1-3-17 al 4-4-17), si bien los contactos para encontrar las personas responsables comenzaron en noviem- bre de 2016. De todos los portales analizados fue posible obtener contacto del responsable en 84 de ellos. Se obtuvieron 27 respuestas completas al cuestionario, lo que supone una tasa de respuesta del 32%. Cada uno de ellos tuvo que responder un cuestionario de 11 preguntas sobre la reutilización de datos en su portal de datos, su conocimiento de los reu- tilizadores y sus políticas de promoción del uso (Anexo 9.2). Por otra parte, se analizó la posibilidad de pasar un cuestionario a los reuti- lizadores de datos, pero los responsables de los portales de datos no tenían información suficiente sobre las organizaciones que reutilizan sus datos por lo que no fue posible realizar este análisis. Como alternativa se ha realizado un análisis directo de las aplicaciones y servicios que los propios portales de datos proporcionan como acreditados reutilizadores de datos, identifi- cando desde este punto a los autores y extrayendo datos de los portales corporativos de cada uno de ellos. Se han muestreado 59 aplicaciones y servicios de los 41 portales que tenían servicios inventariados basados en datos abiertos, elegidos de forma alea- toria. Lo que supone una muestra estadísticamente significativa para un intervalo de 12 puntos con un nivel de confianza del 95%, siguiendo la misma aproximación y herramienta que en el punto anterior.

3.3.

METODOLOGÍA DE ESTUDIO DE LA REUTILIZACIÓN DE LOS DATOS PUBLICADOS

8. La descripción completa de la métrica está disponible en el enlace http://www.meloda.org/full- description-of-meloda/ con licencia Creative Commons 3.0 attibution

26 METODOLOGÍA ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Los datos extraídos para cada uno de estos servicios han sido: • La temática del servicio de acuerdo a la clasificación DCAT-AP (European Union, 2017). • Las características de geolocalización. • La característica de tiempo real del servicio. • El tipo de autor de la aplicación utilizando la clasificación de reuti- lizadores propuesta en la ilustración 6 y descrita en el punto 2.2.2. • El mecanismo de sostenibilidad en el caso de tenerlo. La sostenibili- dad describe la viabilidad económica del servicio a medio plazo, bien porque haya una entidad que soporte los costes o bien porque el servi- cio tenga mecanismos propios de generación de ingresos. Por ejemplo, en el caso de un servicio corporativo, la entidad que lo publica asume sus costes pese a no tener ingresos directamente relacionados. • Si tenía algún modelo de negocio que incluya una fuente de ingre- sos diferente a la de la entidad que publica los datos y en su caso de qué tipo.

27 METODOLOGÍA ·

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

4

DIAGNÓSTICO

4.1.

DIAGNÓSTICO DE LOS PORTALES QUE PUBLICAN DATOS

El primer elemento analizado son las fuentes de datos (portales) que, desde el sector público, pueden alimentar y fomentar la economía basada en datos.

4.1.1.

Actualización de los datos y disponibilidad de API

Del muestreo de 103 portales se detectan los siguientes datos: Sólo el 28 % de los portales tienen un canal que permita saber cuándo un juego de datos ha sido actualizado y sólo el 46% disponen de un meca- nismo automatizado de acceso a los datos ( API o punto de interrogación semántica). Es decir, el 72% de los portales han de ser muestreados de forma periódica por sus reutilizadores, con los problemas que ello comporta de incremento de costes para los mismos y de posible falta de utilización de los datos publicados. Además, teniendo en cuenta que la tendencia es que los datos se actualicen de forma cada vez más frecuente, esto conllevaría multitud de trabajo para los reutilizadores que requieran un muestreo periódico suficiente y para el propio portal que tendrá que estar dando respuesta a peticiones de información 9 . El 54% de los portales no tiene un mecanismo automatizado de acceso (API), lo que supone un problema similar, ya que obliga a los reutilizado- res a descargar todos los datos de un juego de datos, aun cuando solo necesitaran parte de ellos y a procesarlos para poder extraer los datos que realmente necesitan. Finalmente, desde el punto de vista del responsable de publicación de datos, la descarga directa constituye un obstáculo ya que suele estar asociado a accesos anónimos a los recursos lo que impediría un análisis completo de los reutilizadores y los usos que se hacen de los datos. En cuanto al sistema utilizado, el 40% utilizan propiamente un sistema de gestión de datos ( CKAN, Socrata, DKAN, ESRI open data ), mientras que el 43% utiliza una solución no específica (como algunos gestores de conteni- dos como Joomla, Wordpress, Liferay , etc.). Por otra parte, en el 17% de los casos no ha sido posible identificar el gestor de la plataforma, no pertene- ciendo a los anteriores grupos, siendo normalmente desarrollos a medida. El hecho de que no se estén utilizando soluciones específicas de gestión de datos (DMS) (Ver anexo 9.5) compromete la escalabilidad de estos sistemas. No así en cuanto a accesos directos, pero sí en cuanto a sus capacidades de gestión y de extracción de datos desde las organizaciones que los publi- can. De entre los portales en que no se utiliza una solución específica para

Menos de la mitad de los portales de datos posee una sección donde se muestren los servicios creados con sus datos

4.1.2.

Sistema de gestión de datos

9. En este recurso http://meloda.org/feed están consolidados todos los canales con las novedades (nuevos juegos de datos) de los portales analizados en este informe, de tal forma que cualquier novedad en cualquier de ellos (lógicamente solo para aquellos que tienen canal de novedades) pueden ser accesibles en una única fuente.

28

LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA

Page 1 Page 2 Page 3 Page 4 Page 5 Page 6 Page 7 Page 8 Page 9 Page 10 Page 11 Page 12 Page 13 Page 14 Page 15 Page 16 Page 17 Page 18 Page 19 Page 20 Page 21 Page 22 Page 23 Page 24 Page 25 Page 26 Page 27 Page 28 Page 29 Page 30 Page 31 Page 32 Page 33 Page 34 Page 35 Page 36 Page 37 Page 38 Page 39 Page 40 Page 41 Page 42 Page 43 Page 44 Page 45 Page 46 Page 47 Page 48 Page 49 Page 50 Page 51 Page 52 Page 53 Page 54 Page 55 Page 56 Page 57 Page 58 Page 59 Page 60 Page 61 Page 62 Page 63 Page 64 Page 65 Page 66

Made with FlippingBook - Online Brochure Maker