Sean dos muestras de tamaño $n$ , $x_i$ y $y_i$ de dos distribuciones normales diferentes.
¿Qué es la $\operatorname{cov}(\bar X_n, \bar Y_n)$ ? ¿Y cómo puede estimarse?
La motivación de mi pregunta es entender si hay una manera de saber si dos muestras emparejadas están correlacionadas de tal manera que sus expectativas "deberían" ser comparadas usando la prueba t emparejada.
Gracias.
0 votos
¿Quiere decir que tiene emparejado datos $(x_i,y_i)$ y desea determinar si debe utilizar una prueba emparejada o no emparejada para comparar $\overline{x}$ a $\overline{y}$ ? Si no se dispone de tal emparejamiento, ¿cómo se propone dar sentido a una covarianza en primer lugar? Mi preocupación es que si basas una decisión preliminar de utilizar o no una prueba emparejada inspeccionando estos datos, entonces cambiarás el tamaño y la potencia de la prueba que elijas (de forma complicada), invalidando así cualquier valor p que produzca.
0 votos
Hola Whuber. En primer lugar, sí, los datos están emparejados. En segundo lugar - Estoy de acuerdo con usted en que la prueba t post-test no es una cosa fácil de entender. Siéntase libre de asumir que las dos pruebas se realizan en dos muestras diferentes.
0 votos
¿No está claro tu curso de acción, entonces? Si el primer conjunto de datos tiene una covarianza positiva, utilice una prueba t emparejada para el segundo conjunto; de lo contrario, utilice una prueba t no emparejada. Creo que este procedimiento tiene una potencia media mayor que cualquier otro (condicionado a observar el primer conjunto y seleccionar la forma de la prueba t antes de observar el segundo conjunto).
0 votos
Hola Whuber. Estoy de acuerdo contigo. Sin embargo, estoy tratando de entender cuál es la relación entre el cov de mis observaciones a la de sus promedios (ya que, si he entendido bien, la ganancia en la prueba pareada se debe a tener: $var(\bar x - \bar y)=var(\bar x)+var(\bar y)-2*s_x*s_y*cov(\bar x , \bar y)$ (aún no sé cómo funciona la última pieza)