11 votos

correlación de los medios de muestra bootstrap

Dada una muestra $\{x_1,\dots,x_n\}$, $z_1$ y $z_2$ son dos bootstrap realizaciones de la muestra significa, que es, $$z_1 = \frac{1}{n}\sum\{x\in\text{bootstrap sample 1}\}$$ $$z_2 = \frac{1}{n}\sum\{x\in\text{bootstrap sample 2}\}$$ , cómo calcular el $corr(z_1, z_2)$?

ACTUALIZACIÓN

Para asegurarme de que entiendo el problema correctamente, aquí es lo que estoy tratando de resolver:

enter image description here

Aquí es lo que he intentado, como @probabilityislogic sugerido, $$z = \frac{1}{n}\sum(x_ik_i) ;k_1+k_2+\cdots+k_n = n$$ , ya que este es un bootstrap de la muestra, por lo $x_i$ son constantes y $k_i$ son variables aleatorias que $$(k_1,k_2,\cdots,k_n) \sim Mult(k_1k_2\cdots k_n|n, p_1,p_2,\cdots,p_n)$$ . Traté de calcular la media y la varianza como este, \begin{align*} E(z) &= \sum_k\begin{pmatrix}n\\ k\end{pmatrix}p^kz\\ &= \sum_k\begin{pmatrix}n\\ k\end{pmatrix}p^k(\frac{1}{n}\sum_{i=1}^n x_ik_i)\\ &= \frac{1}{n}\left[\sum_k\begin{pmatrix}n\\ k\end{pmatrix}p^k(x_1k_1+\cdots+x_nk_n)\right]\\ &= \frac{1}{n}[np_1x_1+\cdots+np_nx_n]\\ &= p_1x_1+\cdots+p_nx_n \end{align*} y desde cada una de las $k_i$ podría ser cualquier número en $[0,n]$,, a continuación,$p_i = \frac{1}{n+1}$, ¿verdad? Si es así, $$E(z) = \frac{n}{n+1}\bar x$$ .

Para calcular la covarianza, \begin{align*} Cov(z_1, z_2) = \sum_{k_{z1}, k_{z2}}\left[\text{Pr}(k_{z1},k_{z2})(z_1 - E(z))(z_2 - E(z))\right] \end{align*} donde $\text{Pr}(k_{z1}, k_{z2})$ es la probabilidad conjunta de $k$ para $z_1,z_2$. Estoy en el buen camino aquí para covarianza de $z_1$ e $z_2$?

Me parece que no puede entender, parece demasiado complicado para mí.

8voto

Aaron Puntos 541

Yo solía pensar que la respuesta debe ser 0, pero veo lo que hice mal antes. El problema no está buscando el condicionado de correlación, por lo que sin pérdida de generalidad, podemos ver en el caso de que $\mu=0,\sigma^2=1$:

Deje $x_i^{(k)}$ se muestra de $i$ de la $k$th bootstrap.

A continuación,$\bar{x}_k^* = \frac{1}{n} \sum_{i}{x_i^{(k)}}$.

Los valores de la clave que necesitamos para calcular son:

$E\ x_i^{(k)}=E(E[x_i^{(k)}|\mathbf{x}])=E \bar{x}=0$

$var(x_i^{(k)})=E(var(x_i^{(k)}|\mathbf{x}))+var(E[x_i^{(k)}|\mathbf{x}])=\frac{n-1}{n}+\frac{1}{n}=1$

$cov(x_i^{(1)},x_j^{(2)})=E(x_i^{(1)}-0)(x_j^{(2)}-0)=E(E[x_i^{(1)}x_j^{(2)}|\mathbf{x}])=E\bar{x}^2=\frac{1}{n}$

(lo mismo es cierto para $(x_i^{(k)},x_j^{(k)}) \, i\neq j$)

Con lo anterior, el cálculo de los siguientes debe ser fácil:

$cov(\bar{x}_1^*,\bar{x}_2^*)=\frac{1}{n^2} (\sum_{i,j}{cov(x_i^{(1)},x_j^{(2)})})=\frac{1}{n}$

$var(\bar{x}^*_i)=\frac{1}{n^2}\left(n*var(x_1^{(1)})+n(n-1)*cov(x_1^{(1)},x_2^{(1)}) \right)\\ \quad \quad \ \ = \frac{2n-1}{n^2}$

$\rightarrow corr(\bar{x}_1^*,\bar{x}_2^*)=\frac{n}{2n-1}$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X