Con un tamaño de muestra tan pequeño, la hipótesis de normalidad es bastante importante. Puede considerar la prueba de rangos con signo de Wilcoxon si cree que este supuesto es defectuoso.
Si la población se distribuye normalmente, no existe un tamaño mínimo de muestra. Si la diferencia media es pequeña en relación con la varianza de la población, entonces también tendrá muy poca potencia. Sin embargo, es posible obtener una buena potencia incluso con un tamaño de muestra muy pequeño.
Como ejemplo, suponga que sus diferencias por pares se distribuyen normalmente con una varianza (desconocida) $\sigma^{2} = 1$ . A continuación se muestran las estimaciones monte carlo (utilizando 10000 sims) de la potencia para valores cada vez mayores $0, .5, 1, ..., 5$ de las diferencias medias por pares
Mean Difference Power
[1,] 0.0 0.0512
[2,] 0.5 0.1097
[3,] 1.0 0.2934
[4,] 1.5 0.5250
[5,] 2.0 0.7467
[6,] 2.5 0.8975
[7,] 3.0 0.9648
[8,] 3.5 0.9925
[9,] 4.0 0.9976
[10,] 4.5 0.9998
[11,] 5.0 0.9999
Así que podemos ver que es posible que el emparejamiento $t$ -para seguir teniendo una buena potencia cuando la diferencia media es bastante grande en comparación con la varianza de las diferencias (al menos 2 veces más grande en este caso), incluso si $n=4$ . Hay que tener en cuenta que todo esto se va directamente al traste si las diferencias no se distribuyen normalmente.
Si lo desea, puede observar estas potencias para otros valores de la diferencia de medias y de la varianza utilizando el código R que aparece a continuación (nota: el valor crítico para la $t$ -probar cuando $n=4$ utilizando el límite habitual de 0,05 es 3,182446. Se supone que el valor nulo a probar es 0).
U=seq(0,5,by=.5)
V=U-U
sig=1
for(k in 1:11)
{
Z=rep(0,10000)
for(i in 1:10000)
{
diffs=rnorm(4,mean=U[k], sd=sig)
z=(mean(diffs)-0)/(sd(diffs)/sqrt(4))
Z[i]=z
}
V[k] = mean(abs(Z)>3.182446)
}
X=cbind(U,V)
colnames(X)=c("Mean Difference", "Power")
X
3 votos
Tendrá una potencia muy pequeña con sólo 4 pares, a menos que el tamaño del efecto sea enorme (por ejemplo, si $x_i$ es el peso de una mariposa y $y_i$ es el peso del árbol en el que se encuentra).
0 votos
¡gran ejemplo! Lo utilizaré en mi consulta ahora :-)
1 votos
@shabby Porque el tamaño del efecto depende de un desviación estándar de una respuesta, no veo cómo las mariposas y los árboles proporcionan un buen ejemplo.
0 votos
@whuber: buena captura; supongo que la comparación de la Registros de pesos podría corregirlo (suponiendo que la variación y el ruido de las mediciones sean geométricos).
0 votos
Sólo por curiosidad, me he dado cuenta de que en un artículo reciente Jovanelly y Lane (2012) intentaron hacer una prueba T pareada con un tamaño de muestra de 1 para ambas medias. Tenía la impresión de que esto era una mala idea. ¿Puede alguien aclararme esto?
0 votos
Estaría bien un enlace al documento, y quizás una breve explicación del contexto.
0 votos
@naught101 Me pregunto si Curioso se refiere a este: benthamscience.com/open/togeoj/articles/V006/65TOGEOJ.htm
0 votos
Esta pregunta: ¿Existe un tamaño mínimo de muestra necesario para que la prueba t sea válida? también puede ser de interés para los lectores de este hilo.