F. J. Arteaga Moreno, A. González Cebrián, A. Folch Fortuny, A. J. Ferrer Riquelme

Proponemos un método para construir outliers, basado en la caracterización de la distribución multivariante de los datos mediante un modelo PCA.
El modelo PCA nos proporciona dos estadísticos que evalúan, de manera complementaria, en qué medida una observación puede considerarse un outlier y que tipo de outlier es: el SPE (distancia de la observación a su proyección en el modelo) y la T2 de Hotelling (distancia de la proyección de la observación al centro del modelo).
La propuesta consiste en encontrar dos direcciones, ortogonales entre sí, para desplazar una observación de manera que cada una de ellas modifica uno de los dos estadísticos sin que el otro varíe: tomamos una observación, con un valor dado de la T2 y del SPE y la desplazamos hasta que tenga un valor deseado para la T2 y para el SPE que la convierten en un outlier del tipo deseado y controlando cómo de atípico es. Este nivel de control es útil para evaluar la robustez de los métodos estadísticos multivariantes.

Keywords: Outliers, PCA, T2 de Hotelling, SPE

Scheduled

Multivariate Analysis
November 8, 2023  12:00 PM
CC4: Room 2


Other papers in the same session


Cookie policy

We use cookies in order to be able to identify and authenticate you on the website. They are necessary for the correct functioning of it, and therefore they can not be disabled. If you continue browsing the website, you are agreeing with their acceptance, as well as our Privacy Policy.

Additionally, we use Google Analytics in order to analyze the website traffic. They also use cookies and you can accept or refuse them with the buttons below.

You can read more details about our Cookie Policy and our Privacy Policy.