Le site La página de Wikipedia sobre el ANOVA enumera tres supuestos a saber:
- Independencia de los casos: es un supuesto del modelo que simplifica el análisis estadístico.
- Normalidad: las distribuciones de los residuos son normales.
- La igualdad (u "homogeneidad") de las varianzas, llamada homocedasticidad...
El punto de interés aquí es el segundo supuesto. Varias fuentes enumeran el supuesto de forma diferente. Algunas dicen que la normalidad de los datos brutos, otras afirman que la de los residuos.
Surgen varias preguntas:
- ¿son la normalidad y la distribución normal de los residuos la misma persona (basándome en la entrada de la Wikipedia, diría que la normalidad es una propiedad, y no pertenece a los residuos directamente (pero puede ser una propiedad de los residuos (texto profundamente anidado entre paréntesis, raro))?
- Si no es así, ¿qué suposición debería mantenerse? ¿Una? ¿Las dos?
- si la suposición de que los residuos se distribuyen normalmente es la correcta, ¿estamos cometiendo un grave error al comprobar únicamente la normalidad del histograma de valores brutos?