Me gustaría animar a la OP a separar conceptualmente la matemática y la estadística de los principios de análisis de VARIANZA.
Principios matemáticos de ANOVA
Considerar la variable
Yk,k=1,…,N, con varianza de la muestra s2=∑Nk=1(Yk−ˉY⋅)2. Ahora considere una agrupación índice i=1,…,I sin un significado concreto que divide 1,…,N a igual (por conveniencia) grupos de tamaño n. Entonces podemos reescribir la varianza como
s2=I∑i=1n∑j=1(Yij−ˉY⋅⋅)2/(N−1).
Esta es la misma cantidad exacta con un diferente esquema de indexación. Las siguientes dos operaciones de resta y agregar el grupo de medios, y la expansión de la plaza (se necesita la demostración de que el producto va a cero), es totalmente algebraicas:
(N−1)s2=I∑i=1n∑j=1(Yij−ˉYi⋅+ˉYi⋅−ˉY⋅⋅)2=nI∑i=1(ˉYi⋅−ˉY⋅⋅)2+I∑i=1n∑j=1(Yij−ˉYi⋅)2.
Las matemáticas no se preocupa de la interpretación de estos términos, y la descomposición siempre funciona (al menos para el diseño).
Principios de la estadística de ANOVA
Hasta ahora, en este ejemplo, no solo la distribución de la declaración fue hecha acerca de Yk o de la re-indexado Yij, y eso es debido a que la matemática de la descomposición no necesita. Una estadística dispositivo, la hipótesis nula de que no hay efectos de grupo, junto con la suposición de normalidad, conduce a Yij∼N(μ,σ2) todos los i,j.
No voy a ir a través de cada paso en el camino de la estadística F, pero tenga en cuenta que la varianza de la muestra de ˉYi⋅∑Ii=1(ˉYi⋅−ˉY⋅⋅)2/(I−1), y, cuando se escalan por la constante apropiada, tiene un χ2I−1 distribución. Usted probablemente puede "ver" esta cantidad en la descomposición anterior, y así como sugerencias de la estadística F si se divide el primer término por el segundo.
En Casella y Berger texto de la Inferencia Estadística, tanto en t F distribuciones son introducida en virtud de la sección "Las Distribuciones Derivadas." Hasta donde yo sé, la distribución F se deriva ad hoc (de una escala de proporción de χ2 variables aleatorias) para los propósitos de la prueba de ANOVA hipótesis nula.