5 votos

Cómo es robusto ANOVA cuando los tamaños de los grupos son desiguales y de los residuos no están distribuidos normalmente?

Entiendo que hay grados de confianza que se puede tener en el resultado de la ANOVA. Sin embargo, yo naturalmente desea maximizar la cantidad que puedo confiar en mis resultados.

Pregunta: Si tengo los datos que violan el supuesto de normalidad (de residuos), la robustez es un ANOVA cuando tamaños de celda son desiguales? Mi tamaños de celda del rango de 42 a 55, para un 2x3 entre-sujetos de ANOVA.

4voto

Sean Hanley Puntos 2428

Supongo que depende de a qué te refieres por "robusto", hay diferentes formas en que el proceso puede ir mal. Si los residuos se distribuyen de forma simétrica, pero simplemente no es normal, y no tiene otros problemas que no se menciona (p. ej., falta de datos, no se trata de un ANOVA como @JeromyAnglim puntos), luego sus estimaciones de los parámetros debe ser imparcial. Por otro lado, dependiendo de la distancia que los datos difieren de la normalidad, 42 - 55 puede no ser suficiente para que el Teorema del Límite Central para patear en y cubierta para usted. Es decir, su valor de p, puede ser apagado. Qué tan lejos (como usted puede haber adivinado de la frase anterior), dependerá de la cantidad de los residuos difieren de la normalidad, con sólo pequeñas diferencias, probablemente esté bien. En un poco diferente nota, recuerde que si su varianzas no son iguales la prueba no será máximamente eficaz (lea: reducción de potencia). Otra sugerencia: con respecto a la no-normalidad, sesgar, especialmente con las diferentes células sesgada en diferentes direcciones, es peor que tener exceso de curtosis no es igual a 0.

Actualización: a Menos que usted tiene una clara razón para creer que los datos provienen de algunas otras específicas de distribución (por ejemplo, son cuentas), la pregunta es simplemente acerca de la asimetría y el exceso de curtosis. La mejor discusión que he visto de estos temas aquí. Tenga en cuenta que en virtud de la asimetría -> interpretar, hay algunas directrices arbitrarias que pueden ser de utilidad, y que en virtud de la curtosis -> visualizar, usted puede ver lo que el rango de posibles valores es [-2, $\infty$). De nuevo, la cuestión es: ¿el Teorema del Límite Central de la cubierta para usted, y que depende de la forma y el alcance de la no-normalidad y la cantidad de datos que tienen. La respuesta a analíticamente va a ser muy difícil, aunque no es demasiado malo a través de la simulación. He realizado algunas simulaciones utilizando distribuciones como el uniforme y el test de la chi-cuadrado con df=1, para explicar la idea de la CLT; incluso a partir de estas distribuciones no normales, la distribución de muestreo de la media converge a la normalidad impresionantemente rápido, de la OMI. Por lo tanto, mi conjetura es que si usted tiene solamente un poco de la asimetría, usted está probablemente bien, dado su tamaño de la muestra, pero por supuesto no puedo darle un final, analítica respuesta.

El problema con la desigualdad de tamaño de celda en el ANOVA es que los factores están correlacionados unos con otros. Que significa que el uso de pruebas estándar (lo que equivale a utilizando el tipo III suma de cuadrados) no utilizar correctamente toda la información disponible. Yo hable de estos temas aquí, con algo de información complementaria aquí.

0voto

JW. Puntos 386

Si usted está haciendo un ANOVA de una vía, usted no necesita preocuparse acerca de la gama de Ns que usted menciona. Si usted se está preguntando antes de recolectar los datos, o antes de la finalización de la recolección de datos, también se puede realizar un análisis de la potencia para obtener un nivel de confort que tienen el poder estadístico para detectar una diferencia real si existe.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X