Facilitando la Integración de Datos Estadísticos para Acelerar la Investigación
El objetivo principal de este proyecto es investigar las posibilidades que ofrecen los espacios de datos para permitir a los investigadores el cruzar y combinar los datos obtenidos en sus investigaciones con datos no anonimizados de EUSTAT, obteniendo acceso tan sólo al resultado del análisis.

-
Actividad
Descripción de la actividad de la organización
Eustat es el organismo público de la Comunidad Autónoma de Euskadi productor de información estadística oficial contextualizada y de calidad, destinada a las administraciones públicas vascas, a los agentes sociales y a la sociedad.
Sector
Sector Público
Nº de personas empleadas
100
Localización
c/Donostia - San Sebastián, 1, 01010, Vitoria-Gasteiz, Araba/Álava -
Argumento
Antecedentes
El proyecto surge de la reflexión que se realiza desde la Dirección de Eustat para mejorar la respuesta dada a la comunidad investigadora que tradicionalmente accedía a los datos bajo demanda personándose en las oficinas de Eustat. Así, conscientes de que las restricciones de acceso a sus datos y la inexistencia de un catálogo público para investigadores provocaba un menor uso de los datos y, por tanto, limitaba la generación de conocimiento, desde Eustat se plantean buscar una solución innovadora que permita dar un mejor servicio sin comprometer la seguridad y confidencialidad de los datos.
Reto
El principal reto para Eustat ha sido encontrar un equilibrio entre la protección de datos y permitir el acceso a los mismos, de forma remota por parte de la comunidad investigadora. Es decir, ser capaces de crear un entorno de intercambio de confianza y seguridad establecido mediante mecanismos integrados de gobernanza, organizativos, normativos (secreto estadístico, protección de datos personales, …) y técnicos (establecimiento de conectores certificados, no desvelamiento de secretos, …) al tiempo de que Eustat asume el reto de generar nuevos servicios estadísticos.
Razones para ser considerado un Caso Práctico de Innovación
Porque Eustat es el primer Instituto Estadístico en poner en marcha un innovador “servicio de datos” que permite a los investigadores combinar de forma remota los datos obtenidos en sus investigaciones con datos no anonimizados de Eustat, promoviendo así su explotación. La innovación de esta nueva arquitectura de datos no solo radica en que se realiza en un espacio de datos digital seguro y confiable, sino que en ese entorno de intercambio, Eustat ofrece servicios estadísticos (no solo datos) que facilitan la función analítica al investigador, fortaleciendo así la investigación científica.
-
Descripción
Eustat- Instituto Vasco de Estadística- es el órgano responsable de la producción de información estadística oficial destinada a atender las expectativas y necesidades de las Administraciones Públicas, agentes sociales y sociedad en general. Es la institución de referencia para la provisión de datos sobre Euskadi, una entidad muy comprometida con la mejora continua que viene apostando por metodologías avanzadas y herramientas tecnológicas punteras en la producción de estadística oficial. Su objetivo principal es ofrecer información contextualizada y de calidad para mejorar las decisiones, las políticas y el debate público en una sociedad en continua transformación.
Con voluntad de mejorar el servicio prestado y con ello favorecer la generación de un mayor conocimiento en la sociedad, Eustat ha puesto en marcha un proyecto pionero que busca minimizar las restricciones de acceso a sus datos a uno de los grupos de usuarios más estratégicos para el mundo estadístico como son los investigadores. Para ello, Eustat ha desarrollado una solución innovadora que permite a los investigadores acceder y cruzar datos con Eustat, potenciando así la explotación de datos estadísticos y acelerar su investigación sin comprometer la seguridad, privacidad y confidencialidad de los mismos. Con ello, Eustat cambia su propósito general de compartición de datos por uno específico de compartir datos y ofrecer servicios en un entorno particular como es la comunidad investigadora.
Para ello, se ha desarrollado un espacio de datos en un entorno digital seguro donde se ofrece información a medida a los investigadores, mejorando las prestaciones de Eustat para este colectivo en dos sentidos: 1) poniendo a disposición de los investigadores datos con identificación indirecta y haciéndolo on-line, sin necesidad de desplazarse a las instalaciones de Eustat (como se hacía hasta ahora) y 2) ofreciendo Eustat a cada investigador un catálogo de datos (metadata) y unos servicios determinados (fusión de datos y diversos análisis estadísticos) con unos resultados estadísticos mucho más enriquecedores.
Es importante tener en cuenta que los datos de Eustat son datos sensibles y confidenciales y que se debe garantizar, en todo momento, que los resultados estadísticos obtenidos estén anonimizados antes de ser puestos a disposición del investigador. Es por ello que los datos desagregados permanecen en los servidores de Eustat y las operaciones que se hagan sobre ellos se hacen mediante conectores certificados sin riesgo de afectar el sistema principal.
Este proyecto se ha ejecutado (e impulsado) en el marco de los Bonos Baidata y ha contado con la colaboración- al margen del equipo interno de Eustat- de MIK-Mondragon Unibertsitatea, que ha actuado como representante de las necesidades y objetivos del perfil investigador además de como coordinador del proyecto y de SQS-Software Quality Systems, SA que ha sido el proveedor del Espacio de Datos y que ha ejercido de asesor tecnológico durante todo el proceso. -
Acciones
Las principales acciones realizadas en el marco de este proyecto tienen que ver con:
1. Definición del Caso de Uso y los Actores a involucrar en el proyecto
2. Despliegue de la infraestructura híbrida
3. Definición del flujo de operación. Proceso
4. Diseño de los catálogos necesarios para implementar el Proceso
5. Desarrollo del Sandbox de Ejecución
6. Desarrollo de las herramientas de operación con el espacio de datos
7. Revisión, aceptación y validación
Todo ello en un sistema pensado para ser escalable, que permita diseñar y publicar nuevos servicios. -
Resultados
El proyecto de Eustat, si bien en un estado incipiente, ya ha conseguido resultados tangibles e intangibles que impulsan el futuro de la investigación en Euskadi.
Los principales resultados tangibles han sido:
• Creación de un entorno sanbox funcional permitiendo cruzar y combinar datos entre Eustat y los investigadores de forma remota (tradicionalmente necesidad de personarse en las oficinas de Eustat), en un espacio seguro y con una interfaz amigable.
• Demostración de la utilidad de los espacios de datos para implementar soluciones innovadoras que permitan el acceso y uso de datos sensibles, sin comprometer la privacidad y confidencialidad de los mismos, de una forma ágil y eficiente.
• Mayor cantidad de datos (catálogos) a disposición de la comunidad investigadora.
• Escalabilidad en los servicios ofrecidos por Eustat, de ofrecer datos estadísticos a ofrecer servicios estadísticos.
Asimismo, los principales resultados intangibles han sido:
• Fomento de la cultura de la colaboración.
• Fomento de la cultura de datos abiertos en Euskadi.
• Importante impacto en la comunidad investigadora: facilitando el acceso y cruce de datos, fortaleciendo así la investigación científica.
• Generación de nuevo conocimiento que redunda positivamente en la sociedad en general.
Además, el proyecto ha recibido el Premio a la Excelencia en el III Foro de Baidata.
En un futuro próximo, se espera consolidar el entorno sandbox como una herramienta de referencia para la investigación en Euskadi, atrayendo a investigadores de alto nivel de todo el mundo. -
Contacto
Marivi Garcia Olea
Testimonios
Jose Jabier Zurikarai, Subdirector de Coordinación Técnica y Difusión de Eustat "Con esta innovación, los activos de Eustat contribuyen de una manera más eficiente y enriquecedora al conocimiento que tenemos como sociedad"
xxxxxxxxxxxxx
-
Soluciones relacionadas