Me he encontrado con la afirmación de que cada muestra de arranque (o árbol en bolsas) contendrá en promedio aproximadamente$2/3$ de las observaciones.
Entiendo que la probabilidad de no ser seleccionado en ninguna de las$n$ extracciones de$n$ muestras con reemplazo es$(1- 1/n)^n$, lo que equivale aproximadamente a$1/3$ de probabilidad de no ser seleccionado.
¿Cuál es una explicación matemática de por qué esta fórmula siempre da$\approx 1/3$?