3 votos

División de la suma de cuadrados de tratamiento en ANOVA

Un mantra aparentemente clásico que aparece en unos doce libros de texto de ANOVA que consulté dice aproximadamente lo siguiente: dado cualquier elección de $T-1$ contrastes ortogonales $C_1, \cdots, C_{T-1}$ en un diseño ANOVA de $T$ grupos (de una sola vía) (no necesariamente balanceado), la suma de cuadrados de tratamiento (o "entre grupos") $SS_{Trat}$ se puede descomponer como la suma $\sum_{j=1}^{T-1}SS_{C_j}$ de las sumas de cuadrados de los contrastes $C_j$.

Creo que sería útil tener una prueba de este hecho o una referencia a una, ya que la mayoría de los libros de texto parecen carecer de ella.

No sé si ayuda, pero aquí hay algunas definiciones de las estadísticas involucradas: sea $\overline{Y}_i$ la media de las $n_i$ observaciones en el grupo $i$ y $\overline{Y}$ la media de todas las observaciones; entonces

--un contraste es una combinación lineal $\sum_{i=1}^{T} \lambda_i\overline{Y}_i$ tal que $\lambda_i\in \mathbb{R}$ y $\sum_i\lambda_i=0$;

--si dos contrastes tienen coeficientes $\lambda_i$ y $\nu_i$ tales que $\sum_i\lambda_i\nu_i/n_i=0$, se dice que son ortogonales;

--las sumas de cuadrados se definen como: $SS_{Trat}=\sum_{k=1}^Tn_k(\overline{Y}_k-\overline{Y})^2$ y $SS_C=\dfrac{C^2}{\sum_{i=1}^T\frac{\lambda_i^2}{n_i}}$

muchas gracias.

1voto

DEATHSTRIKER Puntos 1

Dejamos que $C$ denote un contraste como $C=\sum_{i=1}^T\lambda_i\bar{Y}_i$ y el vector $C=(\lambda_1,\cdots,\lambda_t)$. Define $C_0=\sum_{i=1}^Tn_i\bar{Y}_i$. Por lo tanto, $C=\{C_0,C_1,\cdots,C_{T-1}\}$ forma una base ortogonal para $\mathrm{R}^T$, con respecto al producto interno $$\langle C_a,C_b\rangle=\sum_{i=1}^T\frac{\lambda_i^a\lambda_i^b}{n_i}.$$

Entonces, por la identidad de Parseval, para cualquier vector $M\in\mathrm{R}^T$, $$\|M\|^2 = \sum_{i=0}^{T-1}\frac{\langle C_i,M\rangle^2}{\langle C_i,C_i\rangle}.$$ Define $M=(\sqrt{n_1}\bar{Y}_1,\cdots,\sqrt{n_T}\bar{Y}_T)$, y verifica que para este $M$ específico tenemos, $$SS_{C_i}=\frac{\langle C_i,M\rangle^2}{\langle C_i,C_i\rangle}\;\;\;\text{para }i =0,\cdots,T.$$ Por lo tanto, dado que $\|M\|^2=\sum_{i=1}^Tn_i\bar{Y}_i^2$, $$\sum n_i\bar{Y}_i^2=N\bar{Y}^2+\sum_{i=1}^{T-1}SS_{C_i},$$ donde $N=n_1+\cdots+n_T$ y dejamos que $SS_{C_0}=N\bar{Y}^2$. Por lo tanto, $$\sum_{i=1}^{T-1}SS_{C_i}=\sum_{i=1}^Tn_i\bar{Y}^2_i-N\bar{Y}^2=\sum_{i=1}^Tn_i(\bar{Y}-\bar{Y}_i)^2=SS_{treat}.$$

QED


Solo 3 comentarios:

  • El hecho de que $C$ forme una base se sigue del hecho de que las coordenadas de $C_1,\cdots,C_{T-1}$ suman cero. Por lo tanto, cada combinación lineal de ellos tiene esta propiedad. Pero $C_0$ no tiene esta propiedad. Por lo tanto, $C_0$ es ortogonal a $C_1,\cdots,C_{T-1}$. Por otro lado, cada vector ortogonal $T$ forma una base para $\mathrm{R}^T$.
  • La identidad de Parseval establece que para una base ortonormal $\{v_i\}$, tenemos $$\|M\|^2=\sum\langle v_i,M\rangle.$$ Para aplicar esto a la base ortogonal $C$, primero puedes dividir el vector por su longitud para obtener la base orthonormal $\{\frac{C_0}{\sqrt{\langle C_0,C_0\rangle}},\cdots,\frac{C_{T-1}}{\sqrt{\langle C_{T-1},C_{T-1}\rangle}}\}$
  • nota que $\|M\|^2$ no es la longitud Euclidiana. Es la longitud definida por el producto interno.

0voto

user568829 Puntos 136

La respuesta de @pmjn6 no se basa en la notación estándar, por lo que puede ser un poco confusa. Sin embargo, basándose en su respuesta, la identidad de Parseval es la clave para descomponer las sumas de cuadrados. Constructivamente, tomemos los contrastes $$c_l = \frac{1}{\sqrt{l(l+1)}}(\underbrace{1, 1, \ldots, 1}_{l\text{ veces}}, -l, 0, \ldots, 0)^\prime,\quad l=1,\ldots,a-1.$$ Ahora, tomemos $c_0 = 1_a/\sqrt{a}$ donde $1_a$ es un vector de unos. $\{c_0,c_1,\ldots,c_a\}$ forma una base ortonormal para $\mathbb{R}^a$. Según la identidad de Parseval, para cualquier vector $v \in \mathbb{R}^a$, $$\|v\|^2 = \sum_{i=0}^a (c_i^\prime v)^2.$$ Por lo tanto, tomemos $v = \sqrt{n}(\bar{Y}_{1\cdot},\ldots,\bar{Y}_{a\cdot})^\prime$. Tenemos $$\mathrm{SS}_{c_i} = (c_i^\prime v)^2,\qquad i=0,\ldots,a$$, así, $\|v\|^2 = \sum_{i=1}^a n\bar{Y}_{i\cdot}^2$, y $$\sum n\bar{Y}_{i\cdot}^2 = na\bar{Y}_{\cdot \cdot}^2 + \sum_{i=1}^a \mathrm{SS}_{c_i},$$ donde $\mathrm{SS}_{c_0} = na\bar{Y}_{\cdot \cdot}^2$. Por lo tanto, $$\sum_{i=1}^a \mathrm{SS}_{c_i} = \sum_{i=1}^a n\bar{Y}_{i\cdot}^2 - na\bar{Y}_{\cdot\cdot}^2 = \sum_{i=1}^a n(\bar{Y}_{\cdot\cdot}-\bar{Y}_{i\cdot})^2.$$ Las sumas de cuadrados debidas a los contrastes descomponen la suma de cuadrados del tratamiento, o $\mathrm{SSR}_c$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X