11 votos

La oportunidad que muestra bootstrap es exactamente igual a la muestra original

Solo quiero comprobar algún razonamiento

Si mi muestra original es de tamaño $n$ y arranque, luego mi proceso de pensamiento es el siguiente:

$\frac{1}{n}$ es la oportunidad de una muestra extraída de la muestra original, este entonces se reemplaza para un repintado de
Para garantizar el próximo sorteo no la muestra anterior, restringimos el tamaño de muestra a $n-1$. Así, conseguimos este patrón:

$$\frac{1}{n} \cdot \frac{1}{n-1} \cdot\dots\frac{1}{n-(n-1)}$$

Así, $\left(\frac{1}{n-(n-1)}\right)^n$
¿Es esto correcto? Tropiezo en por qué no puede ser $(\frac{1}{n})^n$ en su lugar

17voto

AdamSane Puntos 1825

Tenga en cuenta que en cada momento de observación posición ($i=1, 2, ..., n$) podemos elegir cualquiera de las $n$ observaciones, por lo que hay $n^n$ posible remuestrea (mantener el orden en el que están dibujados) de los cuales, $n!$ son de la "misma muestra" (es decir, contienen todos los $n$ observaciones originales sin repeticiones; esto en cuenta todas las formas de ordenar la muestra empezamos).

Por ejemplo, con tres observaciones, a,b y c, usted tiene 27 posibles muestras:

aaa aab aac aba abb abc aca acb acc 
baa bab bac bba bbb bbc bca bcb bcc 
caa cab cac cba cbb cbc cca ccb ccc 

Seis de esos contener cada uno de a, b y c).

Por lo $n!/n^n$ es la probabilidad de obtener la muestra original de nuevo.

Dejando de lado una aproximación rápida de la probabilidad:

Considerar que:

$${\displaystyle {\sqrt {2\pi }}\ n^{n+{\frac {1}{2}}}e^{-n}\leq n!\leq e\ n^{n+{\frac {1}{2}}}e^{-n}}$$

so

$${\displaystyle {\sqrt {2\pi }}\ n^{{\frac {1}{2}}}e^{-n}\leq n!/n^n \leq e\ n^{{\frac {1}{2}}}e^{-n}}$$

With the lower bound being the usual one given for the Stirling approximation (which has low relative error for large $n$).

[Gosper has suggested using $n! \aprox \sqrt{(2n+\frac13)\,\pi}n^ne^{-n}$ which would yield the approximation $\sqrt{(2n+\frac13)\pi}\,e^{-n}$ for this probability, which works reasonably well down to $n=3$, or even down to $n=1$ depending on how stringent your criteria are.]


(Response to comment:) The probability of not getting a particular observation in a given resample is $(1-\frac{1}{n})^n$ which for large $n$ is approximately $e^{-1}$.

Para más detalles, ver
¿Por qué en promedio cada bootstrap de la muestra contienen aproximadamente dos tercios de las observaciones?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X