En el artículo sobre el reforzamiento estocástico del gradiente, Friedman (2002) escribe que muestrear la mitad de las observaciones antes de cada iteración es "aproximadamente equivalente a extraer muestras bootstrap en cada iteración". ¿Por qué? No lo explica, y me cuesta entender por qué.
Respuesta
¿Demasiados anuncios?Dado que, por definición, un bootstrap consiste en extraer una muestra aleatoria (con sustitución) que tenga el mismo tamaño de muestra que el conjunto de datos original, es decir, $n$ objetos. Por término medio, al dibujar aleatoriamente $n$ objetos con sustitución de una muestra de $n$ objetos, la probabilidad de que un objeto no sea seleccionado es $(1-1/n)^n=\exp(-1)=0.368$ . Por lo tanto, la probabilidad de que un objeto entre en la muestra bootstrap es $1-0.368 = 0.632$ . Así que lo más probable es que Friedman esté diciendo que el 0,5 está cerca del 0,6.