6 votos

¿Estimar la covarianza de las medias de dos muestras?

Sean dos muestras de tamaño $n$ , $x_i$ y $y_i$ de dos distribuciones normales diferentes.

¿Qué es la $\operatorname{cov}(\bar X_n, \bar Y_n)$ ? ¿Y cómo puede estimarse?

La motivación de mi pregunta es entender si hay una manera de saber si dos muestras emparejadas están correlacionadas de tal manera que sus expectativas "deberían" ser comparadas usando la prueba t emparejada.

Gracias.

0 votos

¿Quiere decir que tiene emparejado datos $(x_i,y_i)$ y desea determinar si debe utilizar una prueba emparejada o no emparejada para comparar $\overline{x}$ a $\overline{y}$ ? Si no se dispone de tal emparejamiento, ¿cómo se propone dar sentido a una covarianza en primer lugar? Mi preocupación es que si basas una decisión preliminar de utilizar o no una prueba emparejada inspeccionando estos datos, entonces cambiarás el tamaño y la potencia de la prueba que elijas (de forma complicada), invalidando así cualquier valor p que produzca.

0 votos

Hola Whuber. En primer lugar, sí, los datos están emparejados. En segundo lugar - Estoy de acuerdo con usted en que la prueba t post-test no es una cosa fácil de entender. Siéntase libre de asumir que las dos pruebas se realizan en dos muestras diferentes.

0 votos

¿No está claro tu curso de acción, entonces? Si el primer conjunto de datos tiene una covarianza positiva, utilice una prueba t emparejada para el segundo conjunto; de lo contrario, utilice una prueba t no emparejada. Creo que este procedimiento tiene una potencia media mayor que cualquier otro (condicionado a observar el primer conjunto y seleccionar la forma de la prueba t antes de observar el segundo conjunto).

11voto

AdamSane Puntos 1825

\begin{eqnarray} \text{cov}(\bar X_n, \bar Y_n) &=& \text{cov}(1/n \sum X_i, 1/n \sum Y_j)\\ &=& 1/n^2 \cdot \text{cov}( \sum X_i, \sum Y_j)\\ &=& 1/n^2 \cdot \sum_i \sum_j \text{cov}( X_i, Y_j) \end{eqnarray}

Para ir más lejos, necesitamos especificar algo sobre las covarianzas. Si las muestras son muestras aleatorias iid donde $\text{cov}(X_i,Y_j)$ es constante para todos los $i,j$ :

\begin{eqnarray} \quad\quad &=& 1/n^2 \cdot n^2 \text{cov}( X, Y)\\ \quad\quad &=& \text{cov}( X, Y)\, . \end{eqnarray}

Si en cambio (y como parece ser el caso aquí) estamos hablando de datos emparejados, donde $X_i$ y $Y_j$ sólo están correlacionadas cuando $i=j$ entonces:

\begin{eqnarray} \quad\quad &=& 1/n^2 \cdot \sum_i \sum_j \text{cov}( X_i, Y_j)\\ \quad\quad &=& 1/n^2 \cdot n \cdot \text{cov}( X_i, Y_i)\\ \quad\quad &=& 1/n \cdot \text{cov}( X_i, Y_i)\\ \quad\quad &=& 1/n \cdot \rho\, \sigma_x \sigma_y, \end{eqnarray}

donde $\rho$ es la correlación entre $X$ y $Y$ pares.

2voto

wolfies Puntos 2399

He aquí una respuesta derivada de la teoría de los "momentos de momentos", utilizando la notación de la suma de potencias, y dejando el trabajo sucio a mathStatica. En particular, en notación de suma de potencias, dejemos:

$$s_{a,b}=\sum _{i=1}^n X_i^a Y_i^b$$

Entonces, $\operatorname{cov}(\bar X_n, \bar Y_n)$ = $\operatorname{cov}(\frac{s_{1,0}}{n}$ , $\frac{s_{0,1}}{n}$ ) ... y puesto que el operador de covarianza es sólo el {1,1} CentralMoment, la solución es:

enter image description here

donde $\mu_{1,1}$ denota el {1,1} momento central de la población ...

es decir La solución es:

$$\operatorname{cov}(\bar X_n, \bar Y_n) = \frac{\operatorname{cov}(X, Y)}{n} $$

En caso de independencia, $\operatorname{cov}(X,Y)$ es, por supuesto, cero.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X