10 votos

¿Por qué el bagging utiliza muestras bootstrap?

El bagging es el proceso de crear N aprendices en N muestras bootstrap diferentes, y luego tomar la media de sus predicciones.

Mi pregunta es: ¿Por qué no utilizar otro tipo de muestreo? ¿Por qué utilizar muestras bootstrap?

9voto

Bou Puntos 1859

Una pregunta interesante. El bootstrap tiene buenas propiedades de muestreo, en comparación con algunas alternativas como el jackknife. El principal inconveniente del bootstrap es que cada iteración tiene que trabajar con una muestra tan grande como el conjunto de datos original (lo que puede resultar caro desde el punto de vista informático), mientras que otras técnicas de muestreo pueden funcionar con muestras mucho más pequeñas.

Este documento sugiere que recortar ingenuamente el tamaño de la muestra puede reducir el rendimiento, en relación con el bagging basado en bootstrap, lo que sería una razón para no hacerlo. El artículo también introduce un método novedoso para utilizar muestras más pequeñas en las estimaciones de embolsamiento, evitando esos problemas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X