C. Sebastián Martínez-Cava, C. González Guillén

Los algoritmos existentes en selección de variables establecen algún criterio para seleccionar las variables más influyentes. Con datos reales es frecuente encontrarse con cambios en las relaciones entre variables (concept shift). En este caso, la influencia de una variable no puede ser el único indicador de su calidad, ya que la relación aprendida en la fase de entrenamiento puede no corresponderse con la situación actual. Se propone una nueva metodología de selección de características para problemas de regresión que tiene en cuenta este hecho, utilizando los valores de Shapley para estudiar el efecto de cada variable sobre las predicciones. Se analizan varios ejemplos en los que ocurre concept shift y también ejemplos en contextos estáticos para observar la robustez del algoritmo. Cuando se produce algún cambio en la distribución de los datos, el algoritmo mejora los resultados considerablemente. En las situaciones estáticas se iguala al estado del arte.

Keywords: Concept shift, Regresión, Selección de variables, Valores de Shapley

Scheduled

Statistical Models
November 7, 2023  11:40 AM
CC3: Room 1


Other papers in the same session

Distorsión de conjuntos de probabilidades

D. Nieto Barba, I. Montes Gutiérrez, E. Miranda Menéndez

Predictive capacity of competing risks models

L. Garmendia Bergés, I. Barrio, G. Gómez Melis

Simulación de la distribución EBW

V. Cueva López, M. J. Olmo Jiménez, J. Rodríguez Avi


Cookie policy

We use cookies in order to be able to identify and authenticate you on the website. They are necessary for the correct functioning of it, and therefore they can not be disabled. If you continue browsing the website, you are agreeing with their acceptance, as well as our Privacy Policy.

Additionally, we use Google Analytics in order to analyze the website traffic. They also use cookies and you can accept or refuse them with the buttons below.

You can read more details about our Cookie Policy and our Privacy Policy.