C. Rendón Aguirre, D. Peña, F. J. Prieto Fernández
Se propone una modificación del procedimiento propuesto por Peña y Prieto (Cluster Identification Using
Projections, 2001) para identificar clusters en datos multivariados para adaptarlo a problemas de grandes
dimensiones con varios grupos. El procedimiento se implementa en tres etapas. En la primera
etapa se calculan las proyecciones de los datos sobre las direcciones de máxima y de mínima curtosis y se
utilizan mezclas de normales para detectar heterogeneidad. Si la heterogeneidad es significativa, las observaciones
proyectadas se clasifican en dos grupos diferenciados. Esta etapa se repite para cada subgrupo hasta
que no se identifiquen más grupos en la muestra.
Se comparan diversos procedimientos para la detección de heterogeneidad en las proyecciones, como el uso
de “spacings” o el ajuste de mixturas de distribuciones univariantes.
El comportamiento para varios grupos se estudia mediante experimentos de simulación y se
compara con otros métodos propuestos en la literatura.
Palabras clave: Curtosis, Análisis Multivariante, Cluster, Mixtura de Distribuciones
Programado
X03.3 Clasificación
7 de septiembre de 2016 10:00
Aula 21.08