5 votos

¿Se puede utilizar la prueba t para comparar grupos con un tamaño de muestra de 3?

Me pregunto si la prueba t puede utilizarse para un tamaño de muestra realmente pequeño. Tengo un conjunto de datos con sólo 3 entradas para cada grupo y necesito comparar si los dos grupos son significativamente diferentes.

0 votos

Con tres casos por grupo, yo no realizaría ninguna prueba, sino que haría un análisis cualitativo (es decir, describiría los grupos y las diferencias en su informe, caso por caso). Compruébelo: stats.stackexchange.com/questions/121852/

0 votos

Gracias. He leído en alguna parte que puedo utilizar una prueba de permutación, pero estoy buscando algo que sea un poco más sencillo y que puedan utilizar los estudiantes de secundaria. Reunir más datos no es factible.

0 votos

Aún puedes hacerlo, pero no es muy preciso.

7voto

jldugger Puntos 7490

La prueba de permutación tendrá una potencia insuficiente. (Simplemente no hay suficientes formas diferentes de dividir seis muestras en dos grupos de tres). Pero Si se cumplen los supuestos de la prueba t, entonces sus resultados son válidos.

Muchos lectores reflexivos se preguntarán si esta situación podría darse realmente. Permítanme compartir una historia real. Se trata de la limpieza de la contaminación por plomo en un campo: durante años, un agricultor aceptó baterías "recicladas" y las vertió detrás de su casa. Al final, las autoridades medioambientales le pillaron. Hicieron que la "parte responsable" pasara por tres fases de limpieza: (1) tomar muestras del suelo para estimar la cantidad y el alcance de la contaminación por plomo; (2) retirar el suelo en capas finas, tomando muestras en el proceso, hasta que estuviera claro que se había llegado a suelos limpios; (3) tomar muestras independientes de todo el suelo restante y comprobar formalmente si la concentración media de plomo está por debajo de la norma medioambiental.

El procedimiento para (3) fue diseñado y aprobado antes de que empezara la limpieza. Exigía un muestreo aleatorio de todos los suelos expuestos durante la excavación, el análisis de las muestras por un laboratorio certificado y la aplicación de una prueba t de Student. Equivalentemente, para demostrar el éxito, un límite superior de confianza (UCL) adecuado de la media debía ser inferior a la norma. No se especificaba cuántas muestras había que tomar: eso lo decidiría la parte responsable.

Durante las dos primeras fases se obtuvieron y analizaron casi mil muestras. Aunque éstas permitieron caracterizar de forma fiable las distribuciones (univariante y espacial) de las concentraciones de plomo, por supuesto no representaban la resto concentraciones. Sin embargo, sí sugirieron la forma de la distribución (univariante) de las concentraciones restantes. La teoría física y química, la ciencia de los suelos y la experiencia en la rehabilitación de suelos con plomo en otros lugares respaldan esta caracterización estadística.

La limpieza fue tan exhaustiva y satisfactoria que la concentración media probable fue insignificante, más de un orden de magnitud inferior a la norma. Todos los análisis de potencia, basados en estimaciones pesimistas (altas) de la desviación típica, sugerían que una muestra aleatoria de sólo dos o tres sería necesario.

Había muchas complicaciones potenciales: por ejemplo, cualquier zona que se hubiera pasado por alto durante la excavación podría introducir grandes valores periféricos. Para detectarlos, se obtuvo un gran número de muestras en lugares aleatorios, y luego se componen en grupos para producir sólo cinco muestras físicas para las pruebas de laboratorio. Todos los valores eran bajos. Como era de esperar, una prueba t de dos de esas muestras cualesquiera habría demostrado el logro.

En este breve estudio de caso hay ejemplos de varias formas de garantizar que una prueba t es adecuada incluso con muestras pequeñas: la experiencia, la teoría, el muestreo preliminar relacionado, la formulación de hipótesis pesimistas y la composición de la muestra han desempeñado un papel, y cualquiera de ellos podría haber bastado para justificar la prueba t.


Por cierto, existen versiones de la prueba t que funcionan con una sola observación. Se basan en obtener estimaciones independientes de la varianza o, en su defecto, teoría matemática. ¿Podría esto tener sentido en la realidad? La clásica situación de componer la sangre de cientos de soldados para detectar enfermedades venéreas ofrece una posible aplicación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X