C. Sebastián Martínez-Cava, C. González Guillén
Los algoritmos existentes en selección de variables establecen algún criterio para seleccionar las variables más influyentes. Con datos reales es frecuente encontrarse con cambios en las relaciones entre variables (concept shift). En este caso, la influencia de una variable no puede ser el único indicador de su calidad, ya que la relación aprendida en la fase de entrenamiento puede no corresponderse con la situación actual. Se propone una nueva metodología de selección de características para problemas de regresión que tiene en cuenta este hecho, utilizando los valores de Shapley para estudiar el efecto de cada variable sobre las predicciones. Se analizan varios ejemplos en los que ocurre concept shift y también ejemplos en contextos estáticos para observar la robustez del algoritmo. Cuando se produce algún cambio en la distribución de los datos, el algoritmo mejora los resultados considerablemente. En las situaciones estáticas se iguala al estado del arte.
Palabras clave: Concept shift, Regresión, Selección de variables, Valores de Shapley
Programado
Modelos Estadísticos
7 de noviembre de 2023 11:40
CC3: Sala 1