Inicio masINE

Noticias del Instituto Nacional de Estadística

Está Vd. en: Revista digital del INE

Hacia un marco de referencia para incorporar datos móviles a la producción estadística

02-07-19

El marco comprende desde la generación de datos móviles a la elaboración de estadísticas El marco comprende desde la generación de datos móviles a la elaboración de estadísticas

El pasado mes de junio se celebró una sesión técnica en la sede del INE en Madrid en la que se expusieron las líneas primordiales de un marco metodológico de referencia en construcción en el Sistema Estadístico Europeo (SEE) para la incorporación de datos de telefonía móvil en la producción estadística oficial.

La sesión fue impartida por Fabio Ricciato, de la unidad de Innovación y Metodología de Eurostat, y David Salgado, del departamento de Metodología y Desarrollo de la Producción Estadística del INE, que coordina el paquete de trabajo de datos de telefonía móvil del proyecto europeo ESSnet on Big Data y participa también en su paquete de trabajo de metodología y calidad.

El uso de este tipo de datos y de otras nuevas fuentes digitales en general se enmarca en este proyecto ESSnet on Big Data, uno de los proyectos europeos de modernización del SEE bajo la denominada Visión 2020, que marca las líneas directrices para esta modernización.

Aplicación al proceso estadístico

El marco en desarrollo se construye aplicando los principios de modularidad y funcionalidad al proceso estadístico, desde la generación de los datos en las redes de telefonía móvil, hasta la elaboración de las estadísticas en los diversos dominios de interés (turismo, demografía, etc.).

La división en módulos aborda de modo sostenible diversas cuestiones críticas de distinta naturaleza: resolución espacio-temporal limitada en la geolocalización de los dispositivos, sesgo de selección, complejidad de la semántica de los datos brutos, heterogeneidad entre las diversas compañías o la imparable evolución de la tecnología (2G, 3G, 4G, 5G…), entre otras.

Los primeros módulos del mayor nivel de la jerarquía dividen el proceso en tres etapas. La primera se centra en la extracción y preprocesamiento de los datos brutos originales generados en las redes de telecomunicaciones. Se trata de una fase dependiente de la tecnología donde la colaboración entre las oficinas de estadística y las compañías de telecomunicaciones es esencial.

En la segunda etapa, los datos extraídos y preprocesados se preparan en un formato que los haga independientes de la tecnología subyacente, de modo que el personal estadístico no requiere de conocimientos profundos en telecomunicaciones para su incorporación al proceso de producción en las oficinas de estadística. Los datos así preparados darán servicio a los diferentes dominios estadísticos (turismo, demografía, mercado laboral, transporte, etc.).

Integración

En la tercera etapa, los expertos de las oficinas nacionales de estadística elaborarán los productos estadísticos que integren esta nueva fuente de datos. Estos datos podrán emplearse para complementar las estadísticas oficiales ya elaboradas.

A su vez, cada una de estas tres fases (llamadas de datos, de convergencia y estadística) deben estructurarse en submódulos que se centren en abordar diversos pasos de producción (geolocalización de los dispositivos, interpolación espacio-temporal, identificación de poblaciones objetivo, etc.).

El marco permite, además, incorporar las medidas de privacidad y confidencialidad de los usuarios de estas redes en conformidad con las normativas europeas y nacionales. El diseño considera la ejecución de las diversas tareas en los mismos sistemas de información de las compañías, evitando así que los datos abandonen su almacenamiento original. Ello facilita su uso para estadísticas públicas de un modo más seguro.

 

NIPO: 096-20-015-8
ISSN: 2255-5625
© INE 2024