14 votos

Varianza de la media de la muestra de la muestra bootstrap

Sean $X_{1},...,X_{n}$ observaciones distintas (sin lazos). Sea $X_{1}^{*},...,X_{n}^{*}$ un muestreo bootstrap (una muestra de la FDE empírica) y sea $\bar{X}_{n}^{*}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*}$. Encuentra $E(\bar{X}_{n}^{*})$ y $\mathrm{Var}(\bar{X}_{n}^{*})$.

Lo que tengo hasta ahora es que $X_{i}^{*}$ es $X_{1},...,X_{n}$ cada uno con probabilidad $\frac{1}{n}$, así que $$ E(X_{i}^{*})=\frac{1}{n}E(X_{1})+...+\frac{1}{n}E(X_{n})=\frac{n\mu}{n}=\mu $$ y $$E(X_{i}^{*2})=\frac{1}{n}E(X_{1}^{2})+...+\frac{1}{n}E(X_{n}^{2})=\frac{n(\mu^{2}+\sigma^{2})}{n}=\mu^{2}+\sigma^{2}\>, $$ lo cual nos da $$ \mathrm{Var}(X_{i}^{*})=E(X_{i}^{*2})-(E(X_{i}^{*}))^{2}=\mu^{2}+\sigma^{2}-\mu^{2}=\sigma^{2} \>. $$

Luego, $$E(\bar{X}_{n}^{*})=E(\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*})=\frac{1}{n}\sum_{i=1}^{n}E(X_{i}^{*})=\frac{n\mu}{n}=\mu $$ y $$ \mathrm{Var}(\bar{X}_{n}^{*})=\mathrm{Var}(\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*})=\frac{1}{n^{2}}\sum_{i=1}^{n}\mathrm{Var}(X_{i}^{*})$$ ya que los $X_{i}^{*}$ son independientes. Esto nos da $\mathrm{Var}(\bar{X}_{n}^{*})=\frac{n\sigma^{2}}{n^{2}}=\frac{\sigma^{2}}{n}$

Sin embargo, no obtengo la misma respuesta cuando condiciono en $X_{1},\ldots,X_{n}$ y uso la fórmula para varianza condicional: $$ \mathrm{Var}(\bar{X}_{n}^{*})=E(\mathrm{Var}(\bar{X}_{n}^{*}|X_{1},...,X_{n}))+\mathrm{Var}(E(\bar{X}_{n}^{*}|X_{1},\ldots,X_{n})) \>. $$

$E(\bar{X}_{n}^{*}|X_{1},\ldots,X_{n})=\bar{X}_{n}$ y $\mathrm{Var}(\bar{X}_{n}^{*}|X_{1},\ldots,X_{n})=\frac{1}{n^{2}}(\sum X_{i}^{2}-n\bar{X}_{n}^{2}$, así que al sustituir estos en la fórmula anterior obtenemos (después de algo de álgebra) $\mathrm{Var}(\bar{X}_{n}^{*})=\frac{(2n-1)\sigma^{2}}{n^{2}}$.

¿Estoy haciendo algo mal aquí? Siento que no estoy usando la fórmula de la varianza condicional correctamente pero no estoy seguro. Cualquier ayuda sería apreciada.

0 votos

Tal vez tu V(E(X|X1..Xn)) no está calculado correctamente. La respuesta debería ser la misma.

0 votos

Seguramente tienes razón, pero esta respuesta no parece ser muy informativa. ¿Podrías señalar cuál parte no es correcta?

6voto

Dee Puntos 238

La respuesta correcta es $\frac{n-1}{n^2}S^2$. La solución es #4 aquí

4voto

tariqsheikh Puntos 58

Esta puede ser una respuesta tardía, pero lo incorrecto en tu cálculo es lo siguiente: has asumido que incondicionalmente tu muestra de arranque es iid. Esto es falso: condicionalmente a tu muestra, la muestra de arranque es iid, pero incondicionalmente pierdes independencia (pero sigues teniendo variables aleatorias identicamente distribuidas). Esto es esencialmente el Ejercicio 13 en All of nonparametric statistics de Larry Wasserman.

0voto

Christian Puntos 21

Para cualquier persona que encuentre esta pregunta en el futuro: el segundo valor de la varianza calculado a partir de la fórmula de varianza condicional (al final de la pregunta) es correcto. El primer valor es incorrecto.

La respuesta anterior que dice "La respuesta correcta es" muestra el valor de la varianza condicional $Var(\bar{X^*_n}|X_1,\dots,X_n)=\frac{n-1}{n^2}S^2$. La varianza incondicional es $Var(\bar{X^*_n}) = \frac{(2n-1)\sigma^2}{n^2} = \frac{\sigma^2}{n}\left(2 - \frac{1}{n}\right)$. Esto se puede leer directamente en el pdf fuente vinculado, pero no se copió correctamente en esta página.

De hecho, el error es que las $\bar{X_i^*}$ no son independientes (solo condicionalmente independientes), por lo que el primer cálculo de $Var(\bar{X^*_n})$ es incorrecto. $Var(\bar{X^*_n}) \neq \frac{1}{n^2}\Sigma_{i=1}^n Var(X_i^*)$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X