Generación de Talento en Big Data

93

Generación de talento Big Data en España

Tipos de datos, modelos de análisis, visualización e interacción. La na- turaleza intrínsecamente probabilística de los datos afectados por incerti- dumbres —debidas por ejemplo a las limitaciones de los instrumentos de medición — tiene que considerarse de manera explícita en el modelado estadístico de los mismos, así como en la parte de visualización asociada. Visualización de datos multi-variados de alta dimensionalidad. Los datos numéricos de alta dimensionalidad suelen representarse y anali- zarse a través de matrices de scatterplot que proporcionan una visión conjunta de las diferentes proyecciones bi o tridimensionales posibles. Los sistemas avanzados permiten el análisis de series multi-temporales de datos multi-variados obtenidos por sensores de todo tipo y por siste- mas de captura de imágenes; así como una previsión mediante métodos MonteCarlo. Una forma de visualizar los datos N-dimensionales (de un número variable de dimensiones) es transformarlos a varias dimensiones (menores y más fáciles de interpretar), mediante lo que se conoce como manifolds . Estas transformaciones mantienen la relación de vecindad, esto es, los patrones que estaban cercanos se visualizan también cerca- nos en el espacio de dos o tres dimensiones para que se pueden extraer las relaciones entre las variables. Visualización de series temporales. El aspecto multi-temporal de los datos es central en muchas actividades de interpretación y análisis. Al- gunos datos, como los relativos al movimiento —como, por ejemplo, las trayectorias— son difíciles de visualizar. El desarrollo de abstracciones específicas y de metodologías de agregación en forma, por ejemplo, de flujos globales entre áreas, pueden usarse para el análisis de las carac- terísticas esenciales de esos movimientos. Este grado de abstracción es ajustable en tiempo real. Visualización de grafos, que permiten el análisis de relaciones entre entidades representadas como nudos de un grafo. Visualización de datos heterogéneos. En muchas disciplinas, los datos son producidos por diferentes fuentes, sensores y simulaciones. Esta hete- rogeneidad representa un desafío específico para las técnicas de análisis. Visualización de datos espaciales. Los sistemas avanzados permiten la fusión de datos multi-temporales geoespaciales. Técnicas de interacción. A nivel de aplicación, todos los sistemas de Visual Analytics (VA) se basan en la interacción del usuario y el analista con los modelos estadísticos de los datos. Los modelos de interacción representan un dominio de investigación todavía muy abierto: por ejem- plo, en arte de contar una historia, entornos virtuales o touch. Evaluación y validación de modelos de análisis y visualización en VA es central en muchas actividades de investigación. De manera progresiva, los sistemas avanzados van integrando funciones de evaluación cuan- titativa del rendimiento de los propios sistemas —tanto de extracción como Visual Analytics—.

4.3.2.REDES Y COMUNIDADES DE CONOCIMIENTO NACIONALES E INTERNACIONALES Y CENTROS DE ACTIVIDADES DE INNOVACIÓN

La aparición de temas específicos de Big Data en los documentos de trabajo de los programas europeos es relativamente reciente, como por ejemplo el programa de trabajo de ICT 2013 o el Single Digital Market . El Big Data apa-

Made with FlippingBook - Online Brochure Maker