Inicio masINE

Noticias del Instituto Nacional de Estadística

Está Vd. en: Revista digital del INE / Otros temas

Comienza el proyecto europeo de inteligencia artificial y aprendizaje automático para la Estadística Oficial

11-04-24

En la reunión se abordó el funcionamiento de cada paquete de trabajo En la reunión se abordó el funcionamiento de cada paquete de trabajo

La reunión inicial del proyecto europeo de inteligencia artificial y aprendizaje automático para la Estadística Oficial “One-stop-shop for AI-ML for Official Statistics” de la Agenda de Innovación del Sistema Estadístico Europeo (SEE) se celebró los pasados días 2 y 3 de abril en la Oficina Federal de Estadística de Alemania.

Se trata del proyecto de mayor duración (cuatro años) financiado por Eurostat en los últimos tiempos, con un presupuesto cercano a los cuatro millones de euros. Un total de 14 institutos nacionales de estadística participan en el mismo, que está coordinado por la Oficina Central de Estadística de Irlanda.

El objetivo general del proyecto es proporcionar un marco de desarrollo de soluciones basadas en la inteligencia artificial y el aprendizaje automático para la producción de estadísticas oficiales, compartiendo los esfuerzos, recursos y herramientas entre los miembros del SEE. Ello facilitará economías de escala y la adopción temprana de propuestas, pruebas de concepto, prototipos y metodologías, abreviando así el camino desde la innovación hasta la producción.

Estructura del proyecto

El proyecto está articulado en 13 paquetes de trabajo. Los seis primeros son de carácter transversal. Se ocupan de la coordinación y comunicación, la plataforma tecnológica, la identificación de necesidades y propuestas en marcha, los estándares y la metodología estadística y, finalmente, la compartición y estructuración del conocimiento.

Los siete restantes paquetes se centran en el desarrollo de casos de uso concretos de estas técnicas a distintas fases y aspectos de la producción estadística. Estos casos abarcan un variado abanico: procesamiento de imágenes satélite y datos de observación terrestre, depuración (detección de errores) e imputación de datos, codificación automática a partir de texto en lenguaje natural, cadenas de suministro a nivel de empresas, uso de grandes modelos generativos de lenguaje y técnicas y aplicaciones de generación de datos sintéticos para la Estadística Oficial.

En esta primera reunión asistieron un coordinador nacional por país, el coordinador de cada paquete de trabajo, un experto de cada instituto participante y Eurostat.

Se trataron y acordaron temas de organización y calendario, así como el funcionamiento del proyecto, en general, y de cada paquete de trabajo. Se identificaron prioridades como la implementación de resultados en la producción de estadísticas en el menor tiempo posible y la compartición y reutilización de soluciones entre todos los miembros del SEE para múltiples estadísticas.

La participación del INE

El INE participa en este proyecto a través de las subdirecciones generales de Metodología y Diseño de Muestras, de Estadísticas Coyunturales y de TIC en diversos paquetes de trabajo, y con varios roles.

En primer lugar, coordinará el paquete de trabajo sobre el uso de técnicas para la imputación, que tiene como objetivos principales los desarrollos metodológicos mediante técnicas de aprendizaje automático, el desarrollo de pruebas de concepto, prototipos y productos viables mínimos y el análisis de los aspectos de calidad relacionados.

Se seguirán tres líneas de trabajo sobre la imputación temprana para la producción de estimaciones adelantadas mejorando así la oportunidad, la imputación más allá de la muestra para incrementar el grado de granularidad de la información estadística y para disminuir la carga de respuesta y la imputación tras la recogida para tratar la falta de respuesta y mejorando la precisión.

Este paquete de trabajo tiene acordada máxima vinculación con el que se ocupa de la depuración (detección) de errores, en el que el INE también participa.

Marco de Inteligencia artificial y aprendizaje automático

Además, el INE aportará expertos en los paquetes de trabajo sobre metodología y estandarización, cuyo objetivo es la creación de un marco metodológico para el uso de la inteligencia artificial y las técnicas de aprendizaje automático en la producción estadística oficial.

Y en el paquete sobre codificación automática a partir de lenguaje natural, con el fin de desarrollar metodologías automáticas de procesamiento de texto para obtener códigos de clasificaciones estadísticas en múltiples circunstancias.

Con el rol de contribuyente, el Instituto tomará parte igualmente en los paquetes de trabajo sobre la construcción de una plataforma tecnológica con herramientas de código abierto para el desarrollo y ejecución de estas técnicas; sobre los modelos de lenguaje grandes y sobre la generación de datos sintéticos.

Con esta participación, el INE comparte esfuerzos por incorporar la inteligencia artificial y el aprendizaje automático en la producción de estadísticas oficiales, persiguiendo la transformación tecnológica, la innovación metodológica y la mejora de la calidad de sus productos.

 

NIPO: 222-24-022-7
ISSN: 2255-5625
© INE 2024