Inicio masINE

Noticias del Instituto Nacional de Estadística

Está Vd. en: Revista digital del INE / Otros temas

Marc Coca y su EMH Project, uno de los ganadores del IV Desafío Aporta de Red.es

09-12-22

Marc Coca, con su galardón Marc Coca, con su galardón

El técnico del Sistema de Salud de Cataluña Marc Coca Moreno ha sido uno de los premiados en el IV Desafío Aporta con su EMH Project. Se trata de una herramienta web que tiene por objetivo ofrecer un entorno interactivo y visual para el análisis de los microdatos de la Encuesta de Morbilidad Hospitalaria (EMH) del INE.

El proyecto se ha desarrollado en el marco del IV Desafío Aporta, convocado por el Ministerio de Asuntos Económicos y Transformación Digital, cuyo objetivo era dar valor a datos de corte sanitario generados por las administraciones públicas. Coca ha recibido el segundo premio por su trabajo. 

Microdatos utilizados

Para Marc Coca, “trabajar con los microdatos que ofrece el INE supone siempre un reto y un placer a la vez. Por un lado, estamos hablando de conjuntos de datos que, habitualmente, son voluminosos por su nivel de desagregación. Por el otro, dan mucho juego: la fina granularidad permite explorar con gran detalle las distintas subpoblaciones, así como establecer relaciones con otros conjuntos de microdatos”.

En este caso, el proyecto ha utilizado dos conjuntos de microdatos: la EMH y el padrón municipal desde 2016 hasta 2020. En total, se han tratado unos 30 millones de registros.

Los microdatos de la EMH ofrecen un registro estructurado de las altas de los hospitales de España con las siguientes variables: provincia del hospital, provincia de residencia del paciente, fecha de alta y días de estancia y diagnóstico principal.

La idea y el proyecto

En un inicio, la idea planteada se centraba en poder ofrecer una herramienta de tipo Business Intelligence (BI) para conseguir análisis rápidos y adaptables de la EMH. Además, se han impuesto un conjunto de requisitos: desarrollo en plataformas de código abierto, disponer de capacidades analíticas propias de la bioestadística y epidemiología, diseño de la aplicación atractivo y adaptado a diferentes dispositivos.

Finalmente, la herramienta tenía que ser modular y fácilmente escalable: los microdatos de la EMH representan de cuatro a cinco millones de registros por año.

El resultado ha sido una aplicación web que integra diferentes entornos tecnológicos: para la parte front-end se ha utilizado React y Redux, para el back-end, Node.js y Python y, finalmente, PostgreSQL y Pentaho para la base de datos.

Según explica Coca, todo ello no sólo ha permitido materializar una aplicación a coste cero, responsive y con la posibilidad de implementar métodos bioestadísticos ad hoc, sino también poder compartir el código libremente sin infringir ningún tipo de licencia.

Indicadores de la aplicación

La aplicación ofrece el análisis de cuatro grandes indicadores distribuidos y analizados según tres temáticas y siempre pudiendo seleccionar de forma interactiva el periodo de referencia, las características del hospital y del paciente y la información asociada al diagnóstico principal.

Los indicadores analizados son: el número de altas, la cantidad y proporción de exitus (defunciones), la estancia media y la morbilidad poblacional. Además de la presentación de estadísticas descriptivas se ofrece el cálculo de KPI, indicadores epidemiológicos estandarizados según distintas características. Se estudian también los flujos de pacientes de unos territorios a otros por medio de las altas hospitalarias que se recogen en la EMH.

Todo ello se acompaña de gráficos, mapas y tablas para facilitar su visualización y poder detectar rápidamente si existen grupos poblaciones destacables por motivos concretos, ya sea por las características del paciente, su procedencia territorial o la patología que motiva el ingreso.

Retos de futuro

A la aplicación se puede acceder desde https://emh-demo.herokuapp.com/  

Aunque el proyecto ya se encuentra en funcionamiento, Coca apunta que quedan temas que tratar, como su mantenimiento, la optimización del código o la mejora de la presentación.

Y uno de los más importantes es la fecha de caducidad. “Por un lado, tanto el servidor como la base de datos se sustentan en las versiones gratuitas de prueba de los distintos servicios. Por el otro, el uso de los microdatos de la EMH está sujetos a condiciones como eliminarlos en un determinado periodo de tiempo”.

Otro reto es “mejorar la aplicación, hacerla crecer o, incluso, utilizarla para analizar otro tipo de datos. El código se ha puesto en abierto precisamente para animar a quien quiera a participar y, también, utilizar la arquitectura para desarrollar nuevas aplicaciones”.

En definitiva, concluye el premiado, “es un proyecto completamente abierto y Open Source tanto en lo que respecta al código, como a los datos y las herramientas utilizadas”.

Las fuentes de datos utilizadas en este proyecto son datos abiertos accesibles tanto en la página web del INE como en el portal de datos abiertos datos.gob.es.

 

NIPO: 096-20-015-8
ISSN: 2255-5625
© INE 2022