1 votos

¿Por qué el muestreo del 50% de las observaciones en el refuerzo de gradiente estocástico es equivalente al muestreo bootstrap?

En el artículo sobre el reforzamiento estocástico del gradiente, Friedman (2002) escribe que muestrear la mitad de las observaciones antes de cada iteración es "aproximadamente equivalente a extraer muestras bootstrap en cada iteración". ¿Por qué? No lo explica, y me cuesta entender por qué.

1voto

Timothy Puntos 26

Dado que, por definición, un bootstrap consiste en extraer una muestra aleatoria (con sustitución) que tenga el mismo tamaño de muestra que el conjunto de datos original, es decir, $n$ objetos. Por término medio, al dibujar aleatoriamente $n$ objetos con sustitución de una muestra de $n$ objetos, la probabilidad de que un objeto no sea seleccionado es $(1-1/n)^n=\exp(-1)=0.368$ . Por lo tanto, la probabilidad de que un objeto entre en la muestra bootstrap es $1-0.368 = 0.632$ . Así que lo más probable es que Friedman esté diciendo que el 0,5 está cerca del 0,6.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X