5 votos

Análisis post hoc prueba de ANOVA con muchos grupos

En ambos G*Power y el R pwr paquete, estima el tamaño de la muestra requerido por grupo disminuye a medida que el número de grupos de aumentar. Esto parece un poco contra-intuitivo.

Un juguete ejemplo, supongamos que tengo dos grupos con una diferencia significativa en la media de las estimaciones (Grupo a y Grupo B). Si puedo agregar varios grupos adicionales que tienen los medios idéntica a la gran media de ambos grupos (Grupos C1, C2, C3, ...), el análisis del poder sugiere pequeñas muestras de los Grupo a y del Grupo B son necesarias, lo que haría mi capacidad para detectar diferencias en los dos grupos más débiles. En un extremo, si puedo entrar en 1500 los niveles de un solo factor (f = .25, b = .8, a = .05), ambos programas efectivamente me dicen que tienen el tamaño de los grupos de 2-3.

Mi entendimiento es que el poder de los análisis tanto de los programas de ayuda a evaluar el poder de la VARIANZA total. Por lo tanto, en el juguete ejemplo, estoy más posibilidades de captar una diferencia entre el Grupo a o B, y uno de los del Grupo Cs . Sin embargo, este parece que es un resultado de un aumento en el número de comparaciones y la probabilidad de que algunos de los del Grupo C de las muestras incluyen estimaciones promedio que son valores atípicos. Que no parece ser el tipo de diferencia que quiero recoger.

¿Cuál es el enfoque recomendado en estas circunstancias-o es la "baja" del tamaño de la muestra por grupo correcto? Desde que estoy preocupado con post-hoc de comparaciones de las medias de los grupos, hay un a priori de la potencia de los análisis disponibles para esas pruebas?

2voto

AdamSane Puntos 1825

Porque habrá muchos más error grados de libertad, debería ver un aumento en el $A$ vs $B$ rechazos así como a $A$ o $B$ vs $C_i$ rechazos, debido a las diferencias observadas de un determinado número de errores estándar en tamaño son mucho menos propensos a ser debido al ruido en la medición de la desviación estándar.

Por ejemplo, imagine que el común de la varianza de error, $\sigma^2=1$.

A continuación, la distribución de la estimación de $\sigma^2$ es bastante sesgada (y difundir) cuando sólo hay $A$$B$, pero a medida que agrega más $C$ grupos se obtiene una mucho más fuerte a la idea de la varianza, y esto será, en promedio, a mejorar su capacidad de decirle a y B separados:

enter image description here

(Esto supone que la mitad de los grupos tiene 2 observaciones y la mitad tiene 3 observaciones)

Esa protuberancia en la cola izquierda de la verde densidad inferior a 1 significa que usted obtiene F es grande cuando se $H_0$ es cierto bastante a menudo (porque estás dividiendo por un número reducido más a menudo). Como resultado, se necesita una gran F para estar seguros de que no es sólo la variación aleatoria.

Es por eso que el 5% valor crítico para F(2,3) (es decir, el a vs B sola comparación) es 9.55, mientras que para una F(2,150) (es decir, sólo considerando a vs B, con 98 "C" grupos de ayuda para determinar el $\sigma^2$) es de 3,06.

Ese efecto es parte de por qué usted no necesita muchas observaciones por grupo.


Se debe señalar que si el $C$ grupos tienen media de la población es intermedio entre el $A$ $B$ grupos, entonces usted debe rechazar la nula debido a que de B-C y a-C diferencias. Usted parece pensar que no debería suceder. Eso es simplemente falso. Se debe a suceder (aunque con mucho menos frecuencia por cualquier particular $A-C_i$ o $B-C_i$$A-B$).


La simulación es una herramienta útil para ver que los rechazos se producen con más frecuencia a medida que agrega los grupos.

Me imagino que con muchos grupos y sólo un par de observaciones por grupo a vs B rechazos que finalmente se convertirán en una proporción relativamente pequeña del total de rechazos, pero es sólo $C_j$ vs $C_k$ rechazos que son las decisiones incorrectas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X