24 votos

Diferencia en Medias vs. Diferencia de Medias

Cuando estudiamos medias de dos muestras independientes, se nos dice que estamos mirando la "diferencia de dos medias". Esto significa que tomamos la media de la población 1 ($\bar y_1$) y restamos de ella la media de la población 2 ($\bar y_2$). Entonces, nuestra "diferencia de dos medias" es ($\bar y_1$ - $\bar y_2$).

Cuando estudiamos medias de muestras emparejadas, se nos dice que estamos mirando la "diferencia media", $\bar d$. Esto se calcula tomando la diferencia entre cada par y luego tomando la media de todas esas diferencias.

Mi pregunta es: ¿Obtenemos el mismo ($\bar y_1$ - $\bar y_2$) frente a su $\bar d$ si los calculamos a partir de dos columnas de datos, y la primera vez lo consideramos como dos muestras independientes, y la segunda vez lo consideramos como datos emparejados? ¡He jugado con dos columnas de datos y parece que los valores son los mismos! En ese caso, ¿se podría decir que los diferentes nombres se utilizan solo por razones no cuantitativas?

25voto

trish Puntos 31

(Estoy asumiendo que te refieres a "muestra" y no a "población" en tu primer párrafo.)

La equivalencia es fácil de demostrar matemáticamente. Comienza con dos muestras de igual tamaño, $\{x_1, \dots, x_n\}$ y $\{y_1, \dots, y_n\}$. Entonces define $$\begin{align} \bar x &= \frac{1}{n} \sum_{i=1}^n x_i \\ \bar y &= \frac{1}{n} \sum_{i=1}^n y_i \\ \bar d &= \frac{1}{n} \sum_{i=1}^n x_i - y_i \end{align}$$

Luego tienes: $$\begin{align} \bar x - \bar y &= \left( \frac{1}{n} \sum_{i=1}^n x_i \right) - \left( \frac{1}{n} \sum_{i=1}^n y_i \right) \\ &= \frac{1}{n} \left( \sum_{i=1}^n x_i - \sum_{i=1}^n y_i \right) \\ &= \frac{1}{n} \left( \left( x_1 + \dots + x_n \right) - \left( y_1 + \dots + y_n \right) \right) \\ &= \frac{1}{n} \left( x_1 + \dots + x_n - y_1 - \dots - y_n \right) \\ &= \frac{1}{n} \left( x_1 - y_1 + \dots + x_n - y_n \right) \\ &= \frac{1}{n} \left( \left( x_1 - y_1 \right) + \dots + \left( x_n - y_n \right) \right) \\ &= \frac{1}{n} \sum_{i = 1}^n x_i - y_i \\ &= \bar d. \end{align}$$

0voto

hafichuk Puntos 462

La distribución de la diferencia media debería ser más ajustada que la distribución de la diferencia de medias. Mira esto con un ejemplo sencillo: media en muestra 1: 1 10 100 1000 media en muestra 2: 2 11 102 1000 la diferencia de medias es 1 1 2 0 (a diferencia de las muestras en sí mismas) tiene una desviación estándar pequeña.

0voto

reubano Puntos 369

La barra d es para los datos emparejados que están correlacionados y tendrá un estadístico de prueba diferente en comparación con lo que se usa para una prueba t de dos muestras de medias de muestra independientes. En mi opinión, decir que la diferencia de medias representa d barra y la diferencia entre las medias de muestra representa la diferencia entre y barra sub 1 y y barra sub 2 es más preciso y preciso, siendo coherente con las matemáticas de calcular las estadísticas y cómo se conducen sus pruebas estadísticas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X