16 votos

Tamaño mínimo de la muestra para la prueba t no emparejada

¿Existe una "regla" para determinar el tamaño mínimo de muestra necesario para que una prueba t sea válida?

Por ejemplo, es necesario realizar una comparación entre los medios de 2 poblaciones. Hay 7 puntos de datos de una población y sólo 2 puntos de datos de la otra. Lamentablemente, el experimento es muy caro y lleva mucho tiempo, y no es posible obtener más datos.

¿Se puede usar un test T? ¿Por qué o por qué no? Sírvase proporcionar detalles (se desconocen las variaciones y distribuciones de la población). Si no se puede utilizar una prueba t, ¿puede utilizarse una prueba no paramétrica (Mann Whitney)? ¿Por qué sí o por qué no?

2 votos

Esta pregunta cubre material similar y será de interés para los espectadores de esta página: ¿Existe un tamaño mínimo de muestra necesario para que la prueba t sea válida? .

0 votos

Ver también esta pregunta donde se discuten las pruebas con tamaños de muestra aún más pequeños.

8voto

Berek Bryan Puntos 349

Yo recomendaría utilizar el método no paramétrico Mann-Whitney U prueba en lugar de un t -prueba aquí.

No hay un tamaño de muestra mínimo absoluto para el t -pero a medida que el tamaño de las muestras es menor, la prueba se vuelve más sensible a la suposición de que ambas muestras proceden de poblaciones con una distribución normal. Con muestras tan pequeñas, especialmente con una muestra de sólo dos, tendrías que estar muy seguro de que las distribuciones de la población son normales, y eso tiene que basarse en un conocimiento externo, ya que muestras tan pequeñas dan muy poca información en sí mismas sobre la normalidad o no de sus distribuciones. Pero usted dice que "las varianzas de la población y distribuciones no se conocen" (cursiva mía).

La prueba de Mann-Whitney U no requiere ninguna suposición sobre la forma paramétrica de las distribuciones, sino sólo la suposición de que las distribuciones de los dos grupos son iguales bajo la hipótesis nula.

6 votos

No es una buena recomendación para tamaños de muestra extremadamente pequeños. Con 7 y 2 muestras, la prueba U fallará, sin importar lo grande que sea la diferencia entre la media de los grupos. Mira mi respuesta para ver un ejemplo.

2 votos

Yo secundaría lo que dice @AlefSin. Si es importante para ti sacar conclusiones válidas (y no sólo obtener un valor p) entonces cuanto más resonable suposiciones que pueda hacer, mejor. Si hay información de fondo razonable, también podrías añadir aún más supuestos si hicieras tu análisis en un marco bayesiano.

2 votos

Uno de los problemas es que con tamaños de muestra tan pequeños, el Wilcoxon-Mann-Whitney no puede alcanzar los niveles de significación típicos. Con tamaños de muestra de 7 y 2 nunca obtendrá un resultado significativo al nivel del 5%, por muy flagrante que sea la diferencia. Considere (1,018,1,031,1,027,1,020,1,021,1,019,1,024) frente a (713,2, 714,5): ¡no es significativo al nivel del 5%!

6voto

Elias Puntos 101

(descargo de responsabilidad: hoy no puedo escribir bien: ¡tengo la mano derecha fracturada!)

Contrariamente al consejo de utilizar una prueba no paramétrica en otras respuestas, debe considerar que para tamaños de muestra extremadamente pequeños esos métodos no son muy útiles. Es fácil entender por qué: en los estudios con un tamaño extremadamente pequeño, no puede establecerse ninguna diferencia entre los grupos a menos que se observe un gran tamaño del efecto. Los métodos no paramétricos, sin embargo, no se preocupan por la magnitud de la diferencia entre los grupos. Así, aunque la diferencia entre los dos grupos sea enorme, con un tamaño de muestra minúsculo una prueba no paramétrica siempre fallará al rechazar la hipótesis nula.

Consideremos este ejemplo: dos grupos, distribución normal, misma varianza. Grupo 1: media 1,0, 7 muestras. Grupo 2: media 5, 2 muestras. Hay una gran diferencia entre las medias.

wilcox.test(rnorm(7, 1), rnorm(2, 5))

   Wilcoxon rank sum test

data:  rnorm(7, 1) and rnorm(2, 5)
W = 0, p-value = 0.05556

El valor p calculado es 0,05556, que no rechaza la hipótesis nula (a 0,05). Ahora bien, aunque se aumente la distancia entre las dos medias en un factor de 10, se obtendrá el mismo valor p:

wilcox.test(rnorm(7, 1), rnorm(2, 50))

   Wilcoxon rank sum test

data:  rnorm(7, 1) and rnorm(2, 50)
W = 0, p-value = 0.05556

Ahora te invito a que repitas la misma simulación con la prueba t y observes los valores p en el caso de diferencias grandes (media de 5 frente a 1) y enormes (media de 50 frente a 1).

5voto

Zizzencs Puntos 1358

No existe un tamaño mínimo de muestra para una prueba t; de hecho, la prueba t se diseñó para muestras pequeñas. En los viejos tiempos, cuando se imprimían tablas, se veían tablas de pruebas t para muestras muy pequeñas (medidas por df).

Por supuesto, como ocurre con otras pruebas, si la muestra es pequeña, sólo un efecto bastante grande será estadísticamente significativo.

0 votos

Pero, ¿también será un problema lo contrario? Es decir, ¿podrían los valores atípicos que se muestrearon por casualidad llevar a rechazar falsamente la hipótesis nula? ¿O es un problema mayor la baja potencia para detectar las diferencias? En esta situación concreta, veo una diferencia significativa entre las medias, pero no sé hasta qué punto "confiar" en ella.

2 votos

Con n=2 eres definitivamente vulnerable a la influencia de los valores atípicos, los valores atípicos en la población; ¿cómo puede una muestra de 2 tener un valor atípico dentro de la muestra? :-) Yo no intentaría ninguna estadística inferencial en esta situación. Las perspectivas de llegar a la "verdad" son escasas y te expones a las críticas.

2 votos

La razón por la que el intervalo de confianza será amplio es precisamente porque se puede obtener un valor atípico. Pero la prueba t sigue asumiendo que las muestras proceden de una población normal.

2voto

Peter Puntos 1

Supongo que te refieres a que tienes 7 puntos de datos de un grupo y 2 puntos de datos de un segundo grupo, ambos subconjuntos de poblaciones (por ejemplo, subconjunto de hombres y subconjunto de mujeres).

Las matemáticas para la prueba t se pueden obtener de esta página de Wikipedia . Supondremos una prueba t de dos muestras independientes, con tamaños de muestra desiguales (7 frente a 2) y varianzas desiguales, así que a mitad de esa página. Puede ver que el cálculo se basa en las medias y las desviaciones estándar. desviaciones estándar. Con sólo 7 sujetos en un grupo y 2 sujetos en otro, no se puede suponer que se tienen buenas estimaciones ni de la media ni de la desviación estándar. Para el grupo con 2 sujetos, la media es simplemente el valor que se encuentra exactamente en el medio de los dos puntos de datos, por lo que no está bien estimada. Para el grupo con 7 sujetos, el tamaño de la muestra afecta en gran medida a las varianzas (y, por tanto, a las desviaciones estándar, que son la raíz cuadrada de la varianza) porque los valores extremos ejercen un efecto mucho más fuerte cuando se tiene una muestra más pequeña.

Por ejemplo, si se observa el ejemplo básico en la página de Wikipedia para la desviación estándar verás que la desviación estándar es 2, y la varianza (al cuadrado de la desviación estándar) es por tanto 4. Pero si sólo tuviéramos los dos primeros puntos de datos (el 9 y el 1), la varianza sería 10/2 = 5 y la desviación típica sería 2,2 y si sólo tuviéramos los dos últimos valores (el 4 y el 16), la varianza sería 20/2 = 10 y la desviación típica sería 3,2. Seguimos utilizando los mismos valores, sólo que menos, y podemos ver el efecto en nuestras estimaciones.

Ese es el problema de utilizar estadísticas inferenciales con tamaños de muestra pequeños, sus resultados se verán especialmente afectados por el muestreo.

Actualización: ¿hay alguna razón por la que no se pueda simplemente informar de los resultados por temas e indicar que se trata de un trabajo exploratorio? Con sólo dos casos, los datos son muy similares a los de un estudio de casos, y éstos son (1) importantes para redactar y (2) una práctica aceptada.

0 votos

Gracias Michelle. Es interesante y útil saberlo. Sin embargo, ¿qué recomendarías desde un punto de vista práctico? Teniendo en cuenta esta situación, ¿cuál es la mejor manera de proceder? Gracias.

0 votos

Hola Johnny Puzzled. Sin más información sobre tu situación exacta me siento incapaz de dar más orientación.

0 votos

¿Qué tipo de información se necesita?

1voto

Chris Noe Puntos 8375

Interesante artículo relacionado: 'Using the Student's t-test with extremely low samlpe sizes' J.C.F de Winter (en Practical Assesment, Research & Evaluation) http://goo.gl/ZAUmGW

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X