F. J. Arteaga Moreno, A. González Cebrián, A. Folch Fortuny, A. J. Ferrer Riquelme
Proponemos un método para construir outliers, basado en la caracterización de la distribución multivariante de los datos mediante un modelo PCA.
El modelo PCA nos proporciona dos estadísticos que evalúan, de manera complementaria, en qué medida una observación puede considerarse un outlier y que tipo de outlier es: el SPE (distancia de la observación a su proyección en el modelo) y la T2 de Hotelling (distancia de la proyección de la observación al centro del modelo).
La propuesta consiste en encontrar dos direcciones, ortogonales entre sí, para desplazar una observación de manera que cada una de ellas modifica uno de los dos estadísticos sin que el otro varíe: tomamos una observación, con un valor dado de la T2 y del SPE y la desplazamos hasta que tenga un valor deseado para la T2 y para el SPE que la convierten en un outlier del tipo deseado y controlando cómo de atípico es. Este nivel de control es útil para evaluar la robustez de los métodos estadísticos multivariantes.
Palabras clave: Outliers, PCA, T2 de Hotelling, SPE
Programado
Análisis Multivariante
8 de noviembre de 2023 12:00
CC4: Sala 2