22 votos

¿Hay una prueba estadística para comparar dos muestras de tamaño 1 y 3?

Para un proyecto de ecología, de mi grupo de laboratorio vinagre añadido a 4 tanques que contienen el mismo volumen de agua del estanque, 1 control sin necesidad de elodea (planta acuática) y 3 tratamientos con la misma cantidad de elodea en cada uno. El propósito de agregar el vinagre era para reducir el pH. La hipótesis era que los tanques con elodea gustaría volver a sus valores normales de pH más rápido. Este es realmente el caso. Se midió el pH de cada tanque diariamente por alrededor de dos semanas. Todos los tanques finalmente regresó a su pH natural, pero la longitud de tiempo que fue mucho más corta de los tanques con la elodea.

Cuando le dijimos a nuestro profesor acerca de nuestro diseño experimental, dijo que no existe ninguna prueba estadística que se pueden realizar sobre los datos para comparar el control del tratamiento. Que porque no había replicar para el control (sólo se utiliza un control de tanque), no podemos calcular la varianza y por tanto, no podemos comparar la muestra de medios de control y el de tratamiento. Así que mi pregunta es, ¿es esto cierto? Definitivamente entiendo lo que quiere decir. Por ejemplo, si usted tomó la altura de un hombre y una mujer, no se puede sacar conclusiones acerca de sus respectivas poblaciones. Pero hicimos 3 tratamientos, y la varianza era pequeña. Parece razonable asumir que la varianza sería similar en el control?

Actualización:

Gracias por la excelente respuesta. Tenemos más de agua y elodea del humedal y decidimos llevar a cabo el experimento de nuevo con tanques más pequeños, pero esta vez con 5 controles y 5 tratamientos. Íbamos a combinar esto con los datos originales, pero la partida de pH de los tanques fue lo suficientemente diferentes que no parece válido considerar que el nuevo experimento se tomaron muestras de la misma población que el experimento original.

Hemos considerado la adición de diferentes cantidades de elodea y tratando de correlacionar la velocidad de pH de remediación (medido como el tiempo transcurrido hasta que el pH vuelve a su valor original) con la cantidad de elodea, pero hemos decidido que no era necesario. Nuestro objetivo es sólo para mostrar que la elodea hace una diferencia positiva, no para la construcción de algún tipo de modelo predictivo para exactamente cómo el pH responde a diferentes cantidades de elodea. Sería interesante determinar la cantidad óptima de elodea, pero que probablemente sólo la cantidad máxima que puede sobrevivir. Tratando de adaptarse a una curva de regresión para los datos no sería especialmente iluminadora porque de los diversos complejos cambios que se producen a la comunidad cuando la adición de una gran cantidad. La elodea muere, se descompone, y los nuevos organismos empiezan a dominar, y así sucesivamente.

24voto

AdamSane Puntos 1825

Nota @gung la pregunta; lo que importa. Voy a suponer que el tratamiento fue el mismo para cada tanque en el grupo de tratamiento.

Si usted puede discutir la varianza sería igual para los dos grupos (el que normalmente se asume un two sample t-test de todos modos), usted puede hacer una prueba. Usted simplemente no puede comprobar esta suposición, no importa lo mal que lo violó podría ser.

Las preocupaciones expresadas en esta respuesta a una pregunta relacionada son aún más relevantes para su situación, pero hay menos que puede hacer al respecto.

[Preguntar sobre que es razonable asumir que las varianzas son iguales. No podemos contestar que para usted, que es algo que se tendría que convencer a los expertos en la materia (es decir, los ecologistas) fue una suposición razonable. Hay otros estudios en los que dichos niveles se han medido en virtud tanto de tratamiento como de control? Otros donde las pruebas similares (t de student o test de anova especialmente - apuesto a que usted puede encontrar una mejor precedente) se han realizado o similares supuestos hechos? Alguna forma de razonamiento general se puede ver a aplicar?]

Si $\bar{x}$ es la media de la muestra de tratamiento y $\bar{y}$ es la media de las de control, y ambas son de distribuciones normales con varianza $\sigma^2$, luego $\bar{x}-\bar{y}$ tendrá media de $\mu_x - \mu_y$ y la varianza $\sigma^2 (1/n_x + 1/n_y)$, independientemente de si uno de los $n$s'es 1.

Así que cuando $n_y$ 1,

$$ \frac{(\bar{x}-\bar{y})}{s_x\sqrt{1/n_x+1}} $$

(donde $s_x$ es la desviación estándar calculada a partir de los tratamientos) ser $t$distribuido (con $n_x - 1$ grados de libertad) bajo el null.

Usted puede notar que con la mejor estimación disponible de $\sigma$, $s_x$ se utiliza para $s_p$, esto es exactamente igual que la normal de dos-sample t-test de fórmula con $n_y$ a 1.

Editar:

Aquí está una simulación de la curva de potencia para esta prueba. El tamaño de la muestra en el nulos fue de 10000, en el resto de los puntos fue de 1000. Como se puede ver, la tasa de rechazo en el null es de 0.05, y la curva de potencia, mientras que se requiere una gran diferencia en la población significa tener decente poder, tiene la forma correcta. Es decir, esta prueba se hace lo que se supone.

power curve

(Edición final)

Con un tamaño muestral tan pequeño, este va a ser un poco sensibles a la distribución de la hipótesis, sin embargo.

Si usted está preparado para hacer diferentes supuestos, o desea probar la igualdad de algunos otros cantidad de la población, unas pruebas, todavía puede ser posible.

Así que no todo está perdido... pero en donde sea posible, por lo general es mejor tener al menos algunos de replicación en ambos grupos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X