11 votos

Tamaños de muestra pequeños y desequilibrados para dos grupos: ¿qué hacer?

Tengo los datos para los dos grupos (es decir, muestras) quiero comparar, pero el total del tamaño de la muestra es pequeña (n = 29) y fuertemente desequilibrada (n = 22 vs n = 7).

Estos datos son logísticamente difícil y costoso para recoger, así que mientras 'recoger más datos' como una solución obvia no es útil en este caso.

Un número de diferentes variables se midieron (fecha de salida, fecha de llegada, duración de la migración, etc.) así que hay varias pruebas, algunas de las cuales las desviaciones son muy diferentes (el más pequeño de la muestra que tienen mayor varianza).

Inicialmente un colega ejecutó las pruebas t de estos datos, y algunos fueron estadísticamente significativos con P<0.001, otro no fue significativa con P=0.069. Algunas muestras se distribuyeron normalmente, otros no. Algunas pruebas que participan grandes desviaciones de la 'igualdad' de varianzas.

Tengo varias preguntas:

  1. son los t-tests apropiados aquí? Si no, ¿por qué? ¿Esto sólo se aplican a las pruebas donde los supuestos de normalidad e igualdad de varianzas están satisfechos?
  2. lo que es una alternativa adecuada(s)? Tal vez una prueba de permutación?
  3. desigualdad de la varianza infla el error de Tipo I, pero ¿cómo? y ¿qué efecto tiene la pequeña, desequilibrada tamaño de la muestra tienen en error de Tipo I?

11voto

jasonmray Puntos 1303

T-tests que asumir igualdad de varianzas de las dos poblaciones no son válidas cuando las dos poblaciones tienen diferentes variaciones, y es peor para la desigualdad de los tamaños de muestra. Si el menor tamaño de la muestra es la mayor contradicción de la prueba se han inflado error de Tipo I). El de Welch-Satterthwaite versión de la prueba de t, por otro lado, no asumiendo igualdad de varianzas. Si usted está pensando en el de Fisher-Pitman prueba de permutación, también se asume la igualdad de varianzas (si desea inferir desigual medio de un bajo valor de p).

Hay un número de otras cosas que usted puede ser que desee pensar acerca de :

(1) Si las desviaciones son claramente desiguales son todavía tan interesados en una diferencia entre los medios?

(2) Puede estimaciones del efecto ser de más utilidad que los valores de p?

(3) ¿quieres considerar la naturaleza multifactorial de los datos, en lugar de hacer una serie de univariante comparaciones?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X