Algunos de los métodos/modelos más populares para determinar la calidad del dataset (la información asociada al dataset que facilita la reutilización y ac- cesibilidad al mismo): Las 5-estrellas de Tim Berners-Lee 25 son una forma sencilla de verificación de la calidad técnica de los conjuntos de datos en virtud del formato de pu- blicación:
Poner el dataset disponible en la web (en cualquier formato) bajo una licencia abierta.
Ponerlo disponible como datos estructurados (ej. Excel en lugar de la imagen de una tabla).
No utilizar formatos propietarios (ej. CSV en lugar de Excel).
Usar URIs para identificar cosas, de manera que la gente pueda apuntar a las cosas a través de las URIs.
Enlaza los datos a otros datos para proveerlos de contexto ( linked data ).
25 http://opendatahandbook.org/ glossary/en/terms/five-stars-of- open-data 26 http://www.meloda.org/ wp-content/uploads/2017/03/ Meloda4.11.pdf
Tabla 3 – 5 estrella de TimBernes Lee.
MELODA 26 es un método de evaluación sencillo que permite evaluar la cali- dad de los datasets (se aplica a cada dataset ) en base a los metadatos aso- ciados. FAIR Data maturity model 27 es un modelo en desarrollo, surgido en la co- munidad de la Research Data Alliance (RDA) que trata de crear métricas e indicadores para medir el nivel de encontrabilidad, accesibilidad, interope- rabilidad y posibilidad de reutilización (FAIR) de los conjuntos de datos, ini- cialmente de los datos de investigación, pero como ya hemos mencionado, los principios FAIR son aplicables a cualquier dataset. De hecho, existe toda una dimensión en la web vinculada a los datos que se ha empezado a deno- minar Internet of FAIR Data and Services (IFDS) . Estos métodos/modelos y otros que se aplican en contextos concretos, permi- ten a la organización que comparte/publica datos tener una idea orientativa del valor de sus datos. Sin embargo, lo que realmente dará valor o no al dato será el éxito en su reutilización.
27 https://www.rd-alliance.org/groups/ fair-data-maturity-model-wg
4.4.3 Publicar datos
La publicación de datos se realiza en los canales de compartición/publicación establecidos. Algunos canales de publicación han sido vistos en apartados an- teriores, por lo que aquí cabe mencionar que el canal a utilizar depende del nú- mero de datasets a compartir y se recomienda empezar por las soluciones más sencillas para el número de datasets previsto.
53
Fundamentos técnicos de la apertura/compartición de datos en el entorno empresarial
Made with FlippingBook - Online Brochure Maker