Á. Cía Mina, J. López Fidalgo

Subsampling is commonly employed to improve computation efficiency in regression models. However, existing methods primarily focus on minimizing errors in estimating parameters, whereas the main practical goal of statistical models often lies in minimizing prediction errors. This study introduces a novel approach to selecting subdata for linear models, which takes into account the distribution of covariates. Our method specifically addresses scenarios with large samples where obtaining labels for the response variable is costly. The introduction of the "J-optimality" criterion is supported by theoretical justifications and aligned with standard linear optimality criteria. We also explore sequential selection. As expected based on theory, our method demonstrates a reduction in prediction mean squared error compared to existing methods. Through simulations, we present empirical evidence of the performance and potential of our approach in enhancing prediction accuracy.

Palabras clave: Subsampling, Active Learning, Random-X Regression,

Programado

GT06.DEX1 Sesión Invitada
7 de noviembre de 2023  18:40
CC4: Sala 2


Otros trabajos en la misma sesión

Green Algorithms by using Response surface analysis

H. Grass Boada, J. López Fidalgo, E. Benitez, C. De La Calle Arroyo

Diseño óptimo en ensayos de clonogenicidad.

M. J. Rivas Lopez, J. M. Rodríguez Díaz


Política de cookies

Usamos cookies solamente para poder idenfiticarte y autenticarte dentro del sitio web. Son necesarias para el correcto funcionamiento del mismo y por tanto no pueden ser desactivadas. Si continúas navegando estás dando tu consentimiento para su aceptación, así como la de nuestra Política de Privacidad.

Adicionalmente, utilizamos Google Analytics para analizar el tráfico del sitio web. Ellos almacenan cookies también, y puedes aceptarlas o rechazarlas en los botones de más abajo.

Aquí puedes ver más detalles de nuestra Política de Cookies y nuestra Política de Privacidad.