Con la información obtenida, se ha realizado un análisis de la madurez de los datos de los portales. Para ello, se ha desarrollado una métrica a partir de la propuesta de Carrara et al. (2016). La categorización de los resultados sigue el mismo grupo de categorías que la métrica de reutilización de datos MELODA (Abella et al., 2014). Los aspectos analizados y su importancia se presentan en la tabla 1.
CONCEPTO INFORME EUROPEO PESO
CONCEPTO
Tener más de 30 juegos de datos
Difusión de los datos
20%
Tener una fuente con actualizaciones del catálogo
Usabilidad del portal
10%
Utilizar un sistema de gestión de datos (DMS)
Usabilidad del portal
15%
Tabla 1: Métrica para analizar el grado de madurez de los portales de datos
Disponibilidad de un interfaz de programación de aplicaciones (API) para interacción automatizada con los juegos de datos Portal de aplicaciones / servicios basados en datos abiertos
Reutilización de los datos
25%
Reutilización de los datos
30%
∞ | Fuente: Elaboración propia
a partir de Carrara et al. , 2016
3.2.
METODOLOGÍA DE ESTUDIO DE LOS JUEGOS DE DATOS PUBLICADOS
Para el muestreo de los juegos de datos de los portales, se intentó la auto- matización de la descarga de datos desde los portales. Tras evaluar varias posibles alternativas (parte manual, parte automática) se determinó que no se disponía de recursos suficientes para que la automatización pro- porcionara suficientes resultados (más del 60% de los portales no tenían propiamente un sistema de gestión de datos DMS) por lo que un muestreo automatizado solo proporcionaría un número de datos interesante en el 40% de los casos. Por otra parte, la extensión a otros gestores de portales utilizados (CMS) era todavía más compleja por la mayor dispersión de herramientas utilizadas. Por tanto, el muestreo ha tenido que realizarse de forma manual. En los 103 portales seleccionados se han identificado un total de 20.026 juegos de datos tras realizar un filtrado de los datos federados 7 entre porta- les, que de no filtrarse serían contabilizados en más de una ocasión. Como ejemplo, la web datos.gob.es tiene más de 14.000 juegos de datos listados, si bien aquellos que no están federados de otras fuentes suman 1.200. De igual manera, el portal de la Comunidad de Murcia tiene cinco juegos de datos que no pertenecen a otras entidades y que no han sido contabilizados doble- mente. Teniendo en cuenta la amplitud de la población objeto de estudio, se ha realizado un muestreo de 103 juegos de datos. De acuerdo con la herra- mienta Surveysoftware (http://www.surveysoftware.net/sscalce.htm) se ha seleccionado una muestra estadísticamente representativa de la población con un intervalo de 10 puntos al 95% de confianza.
7. Es un sistema múltiple de base de datos, en el cual, cada nodo en la federación mantiene su autonomía en los datos y define un conjunto de esquemas de exportación, a través de los cuales se hacen disponibles los datos a otros nodos.
25 METODOLOGÍA ·
LA REUTILIZACIÓN DE DATOS ABIERTOS: UNA OPORTUNIDAD PARA ESPAÑA
Made with FlippingBook - Online Brochure Maker