8 votos

¿Cuál es el tamaño mínimo de la muestra para una prueba t pareada y cuál es el equivalente no paramétrico si los datos no son normales?

Tengo 4 pares de muestras, digamos (x1, y1),...,(x4, y4).

  • ¿Cuál es el tamaño mínimo de la muestra para una prueba t pareada?
  • ¿Qué hipótesis debo comprobar para la prueba t emparejada?
  • Si mis datos no son normales, ¿cuál es una prueba alternativa no paramétrica?

3 votos

Tendrá una potencia muy pequeña con sólo 4 pares, a menos que el tamaño del efecto sea enorme (por ejemplo, si $x_i$ es el peso de una mariposa y $y_i$ es el peso del árbol en el que se encuentra).

0 votos

¡gran ejemplo! Lo utilizaré en mi consulta ahora :-)

1 votos

@shabby Porque el tamaño del efecto depende de un desviación estándar de una respuesta, no veo cómo las mariposas y los árboles proporcionan un buen ejemplo.

10voto

Niall Puntos 51

Con un tamaño de muestra tan pequeño, la hipótesis de normalidad es bastante importante. Puede considerar la prueba de rangos con signo de Wilcoxon si cree que este supuesto es defectuoso.

Si la población se distribuye normalmente, no existe un tamaño mínimo de muestra. Si la diferencia media es pequeña en relación con la varianza de la población, entonces también tendrá muy poca potencia. Sin embargo, es posible obtener una buena potencia incluso con un tamaño de muestra muy pequeño.

Como ejemplo, suponga que sus diferencias por pares se distribuyen normalmente con una varianza (desconocida) $\sigma^{2} = 1$ . A continuación se muestran las estimaciones monte carlo (utilizando 10000 sims) de la potencia para valores cada vez mayores $0, .5, 1, ..., 5$ de las diferencias medias por pares

      Mean Difference  Power
 [1,]             0.0 0.0512
 [2,]             0.5 0.1097
 [3,]             1.0 0.2934
 [4,]             1.5 0.5250
 [5,]             2.0 0.7467
 [6,]             2.5 0.8975
 [7,]             3.0 0.9648
 [8,]             3.5 0.9925
 [9,]             4.0 0.9976
[10,]             4.5 0.9998
[11,]             5.0 0.9999

Así que podemos ver que es posible que el emparejamiento $t$ -para seguir teniendo una buena potencia cuando la diferencia media es bastante grande en comparación con la varianza de las diferencias (al menos 2 veces más grande en este caso), incluso si $n=4$ . Hay que tener en cuenta que todo esto se va directamente al traste si las diferencias no se distribuyen normalmente.

Si lo desea, puede observar estas potencias para otros valores de la diferencia de medias y de la varianza utilizando el código R que aparece a continuación (nota: el valor crítico para la $t$ -probar cuando $n=4$ utilizando el límite habitual de 0,05 es 3,182446. Se supone que el valor nulo a probar es 0).

U=seq(0,5,by=.5)
V=U-U
sig=1

for(k in 1:11)
{
   Z=rep(0,10000)
   for(i in 1:10000)
   {
      diffs=rnorm(4,mean=U[k], sd=sig)
      z=(mean(diffs)-0)/(sd(diffs)/sqrt(4))
      Z[i]=z
   }
   V[k] = mean(abs(Z)>3.182446)
}
X=cbind(U,V)
colnames(X)=c("Mean Difference", "Power")
X

1 votos

En R se pueden obtener los mismos resultados utilizando la herramienta más fácil de usar power.t.test que te da flexibilidad sobre lo que mantienes fijo. Por ejemplo, el ejemplo anterior se convierte en for (k in 0:11){cat(sprintf("%f %f\n", k/2, power.t.test(n=4, delta=k/2, sd=1, type="paired")$power))}

1 votos

He leído en alguna parte que la prueba de Wilcoxon requiere un tamaño de muestra mayor n > 20 . ¿Puede comentarlo?

5voto

Zizzencs Puntos 1358

No hay un tamaño mínimo de muestra para una prueba t. Pero como señaló @shabbychef, tendrás muy poca potencia.

1 votos

Puede tener muy poco poder. Si se cumple el supuesto de normalidad, la prueba t seguirá siendo más potente que la prueba de rango con signo, por ejemplo. Me imagino que esto también es cierto para otras pruebas no paramétricas. Por lo tanto, sigue siendo mejor utilizar la prueba t.

0 votos

Técnicamente, ¿el tamaño mínimo de la muestra no sería de dos pares, ya que la desviación estándar/el error no estaría definido con una sola muestra? R's t.test se niega a realizar la prueba con una sola muestra.

0 votos

@macro Mientras que la prueba t tiene una ventaja de potencia en la normalidad, la probabilidad de que los datos sean realmente normales será cero - y no se necesitan cambios terriblemente grandes de la normalidad para que la prueba t pierda la (sorprendentemente pequeña) ventaja de potencia que tiene en tamaños de muestra pequeños cuando sus supuestos son verdaderos. Sería como decir "Para qué comprar un seguro - si conduzco perfectamente, sería una pérdida de dinero"

5voto

AdamSane Puntos 1825

¿Cuál es el tamaño mínimo de la muestra para una prueba t pareada?

En general, para el ordinario prueba t emparejada, dos pares es la más pequeña, produciendo 1 f.d.

¿Qué hipótesis debo comprobar para la prueba t emparejada?

Normalmente, trataría de evaluarlos todos, pero si sólo tienes 4 pares, es casi imposible intentarlo. Tienes cuatro pares-diferencias, de los cuales dos f.d. irían a estimar la media y la varianza de las diferencias (la ubicación y la escala no importan para los supuestos), en esencia dejando dos f.d. para evaluar la varianza cambiante, la dependencia (en cualquier forma que se te ocurra buscar, si la hay) y la normalidad.

Si mis datos no son normales, ¿cuál es una prueba alternativa no paramétrica?

Datos emparejados: Prueba de rango con signo de Wilcoxon; o prueba de signos; o cualquier número de variedades de prueba de permutación o prueba bootstrap (dependiendo de cómo construya su estadística/qué quiere probar exactamente). Todos ellos tienen supuestos, por supuesto.

Pero la prueba t es al menos razonablemente robusta a la no normalidad de las diferencias (y son las diferencias las que se supone que son normales). Si las observaciones están, digamos, ligeramente inclinadas hacia la derecha y no tienen una cola muy pesada, las diferencias pueden ser indistinguibles de la normalidad incluso con tamaños de muestra grandes. Dicho esto, hay pocas razones para evitar la prueba de rango con signo si la no normalidad es la principal preocupación, pero con 4 pares, entonces estás bastante atascado con un nivel de significación del 12,5%.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X