C. Sebastián Martínez-Cava, C. González Guillén
Los algoritmos existentes en selección de variables establecen algún criterio para seleccionar las variables más influyentes. Con datos reales es frecuente encontrarse con cambios en las relaciones entre variables (concept shift). En este caso, la influencia de una variable no puede ser el único indicador de su calidad, ya que la relación aprendida en la fase de entrenamiento puede no corresponderse con la situación actual. Se propone una nueva metodología de selección de características para problemas de regresión que tiene en cuenta este hecho, utilizando los valores de Shapley para estudiar el efecto de cada variable sobre las predicciones. Se analizan varios ejemplos en los que ocurre concept shift y también ejemplos en contextos estáticos para observar la robustez del algoritmo. Cuando se produce algún cambio en la distribución de los datos, el algoritmo mejora los resultados considerablemente. En las situaciones estáticas se iguala al estado del arte.
Keywords: Concept shift, Regresión, Selección de variables, Valores de Shapley
Scheduled
Statistical Models
November 7, 2023 11:40 AM
CC3: Room 1