9 votos

El poder de la prueba de t bajo el desigual tamaño de la muestra

He oído que el poder de un t-test utilizado con la desigualdad de las muestras está limitada por el tamaño de la muestra más pequeña. Puedo tomar esto significa que la potencia de una prueba t con desigual tamaño de la muestra es igual a la potencia de un t-test utilizados en la igualdad de tamaños de muestra donde: $n$ es igual al tamaño de la muestra más pequeña?

16voto

Sean Hanley Puntos 2428

(Nota, por $n$, yo por lo general significa que el total del tamaño de la muestra, por lo que interpreto de su última frase, "donde $\bf{.5}$$n$ es igual al tamaño de la muestra más pequeña'.)

No, no del todo. Considere la posibilidad de esta simulación (con R):

set.seed(9)

power1010 = vector(length=10000)
power9010 = vector(length=10000)

for(i in 1:10000){

  n1a = rnorm(10, mean=0,  sd=1)
  n2a = rnorm(10, mean=.5, sd=1)

  n1c = rnorm(90, mean=0,  sd=1)
  n2c = rnorm(10, mean=.5, sd=1)

  power1010[i] = t.test(n1a, n2a, var.equal=T)$p.value
  power9010[i] = t.test(n1c, n2c, var.equal=T)$p.value
}

mean(power1010<.05)
[1] 0.184

mean(power9010<.05)
[1] 0.323

Lo que vemos aquí es que cuando el total de la muestra el tamaño de la es $20$, con igual tamaño de los grupos, $n_1=n_2=10$, el poder es $18\%$; pero cuando el total del tamaño de la muestra es $100$, pero el grupo más pequeño ha $n_2=10$, el poder es $32\%$. Así, el poder puede aumentar cuando el tamaño del grupo más grande que sube, aunque el pequeño tamaño de la muestra sigue siendo el mismo.

Esta respuesta es una adaptación de mi respuesta a esta pregunta: ¿Cómo se debe interpretar la comparación de medias de los diferentes tamaños de muestra?, lo que probablemente usted desea leer más sobre este tema.

6voto

AdamSane Puntos 1825

Para entender el comentario, tenga en cuenta el efecto de permitir que la segunda muestra de obtener más y más grande mientras que el primero se mantiene constante en el tamaño. Finalmente, la media de la muestra para la segunda muestra converge a la media de la población es que fue extraída de, y el error estándar de la media se convierte en cero. Si examina el ordinario de dos muestras de prueba estadística de

$$t = \frac{\bar {X}_1 - \bar{X}_2}{S_p \cdot \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}$$

entonces como $n_2$ se hace grande, $\bar{X}_2$$\mu_2$, y el término de la raíz cuadrada va a $1/n_1$.

Ahora mira a $S_p$:

$$S_p = \sqrt{\frac{(n_1-1)S_{X_1}^2+(n_2-1)S_{X_2}^2}{n_1+n_2-2}}$$

Deje $w_1 = \frac{n_1-1}{(n_1-1)+(n_2-1)}$ y de manera similar para $w_2$

$$S_p = \sqrt{w_1 S_{X_1}^2+w_2 S_{X_2}^2}$$

Como $n_2$ se hace grande, $w_2$ va a 1, mientras que $S_{X_2}$ va a $\sigma_2$; $S_p$ vuelve $\sigma_2$.

Entonces, ¿qué nos queda? La estadística de ahora se parece a esto:

$$ \frac{\bar {X}_1 - \mu_2}{\sigma_2 / \sqrt{n_1}}$$

Ordinaria de la muestra de la prueba z ... cuyo poder es una función de $n_1$.

Usted puede encontrar que es instructivo considerar el mismo cálculo que en el caso de la Welch t-test (creo que un one-sample t estadística).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X