Inicio masINE

Noticias del Instituto Nacional de Estadística

Está Vd. en: Revista digital del INE / Otros temas

El análisis multivariante y su potencial para interpretar mejor la información

06-04-17

Inés María Cáceres, María del Rosario Cintas y Juana María AlonsoInés María Cáceres, María del Rosario Cintas y Juana María Alonso

Durante el mes de marzo de 2017 ha tenido lugar en la sede del Instituto Nacional de Estadística (INE) el curso “Análisis Multivariante”, impartido por Inés María Cáceres García, Vicedecana de la Facultad de Estudios Estadísticos de la Universidad Complutense de Madrid (UCM), y por Juana María Alonso Revenga y María del Rosario Cintas del Río, profesoras titulares de la misma facultad.

El equipo docente imprimió al curso un estilo metodológico que abundó, sobre todo, en el aspecto práctico de las técnicas, poniendo en valor el interés de prestar especial atención a la interpretación de los datos.

El objetivo genérico del curso fue constatar el potencial que suponen algunas metodologías estadísticas de análisis multivariante en lo referente a la información de carácter socio-económico y, especialmente, a la elaborada por el  INE. 

Mayor competitividad

Según explicaron, en una sociedad cada vez más globalizada, y con la tecnología necesaria para disponer cada vez de más datos, se hace evidente la necesidad de acudir a procedimientos de análisis que nos hagan competitivos frente a otros usuarios de los mismos. En este sentido, el curso intentó poner de manifiesto cómo el conocer la estructura interna de interdependencia que presentan los datos permite, a la vez que un análisis más eficiente de estos, un conocimiento más profundo de la realidad que describen.

El curso abordó la descripción y aplicación de tres técnicas básicas del análisis multivariante, plasmando sobre un conjunto de datos reales (perteneciente a INEbase),  y mediante el uso del paquete estadístico SAS, la utilidad de cada una de ellas.

Como valor añadido a la utilidad individual de cada técnica, el curso permitió comprobar cómo, en algunos casos, una combinación de ellas permite diseñar protocolos de complementación, validación y ayuda a la interpretación de resultados.

Tres técnicas básicas

En el primer módulo se explicó la metodología del Análisis de Componentes Principales y Análisis Factorial para la reducción de la dimensión de un conjunto de datos.

Ambas técnicas utilizan las correlaciones existentes entre las variables observadas para construir nuevas variables (componentes o factores)  cuyo número es muy inferior al de partida, pero que recogen prácticamente toda la información. Esto permite, además de identificar los grupos de variables más interrelacionados que quedarán recogidos por cada factor, mostrar gráficamente el comportamiento de los individuos dependiendo de sus valores en los nuevos factores o componentes. 

En el segundo módulo se explicó la técnica del Análisis Discriminante, encuadrada dentro del ámbito general de los métodos de clasificación supervisada. Partiendo de una primera aproximación de carácter geométrico, se establecieron los fundamentos que proporcionan procedimientos para detectar las diferencias existentes entre los distintos grupos y permiten construir las reglas de asignación sistemática de nuevas observaciones, en base a las mediciones que presentan en las variables clasificadoras.

La tercera y última de las técnicas que se presentaron en el curso correspondió al denominado Análisis Cluster, que aborda el problema de encontrar una posible estructura de  agrupación presente en los datos en el espacio en el que están representados y de la que, a priori, no se dispone de información que la identifique.

Esta última cuestión marca la diferencia sustancial de ámbito de aplicación para esta técnica frente a la de Análisis Discriminante. En aquella, los grupos para los que se debe encontrar la regla de asignación de cada elemento desde el conjunto de variables informativas (clasificadoras) son conocidos y la realidad a la que responden está predefinida e identificada antes de aplicar la técnica.

Por el contrario, en el análisis Cluster la identificación de cada uno de los posibles grupos existentes entre los elementos observados, así como una posible caracterización de la realidad a la que responden son, en esencia, el objetivo último de la técnica.

Las ponentes concluyeron que en todo momento el curso plantea un desarrollo de las técnicas que permite visualizar cómo una utilización adecuada de las mismas puede ayudar a interpretar lo que los datos intentan comunicarnos.

 

NIPO: 096-20-015-8
ISSN: 2255-5625
© INE 2024