Estoy leyendo un libro sobre el "multi-SNP" los datos de GWAS método de análisis, El autor dispone de un modelo lineal $y = \beta_g g + \epsilon$ donde $g$ es un genotipo vector por un solo gen, $\beta_g$ es el verdadero coeficiente de regresión, $\epsilon$ es el error, suponiendo que la línea de regresión pasa por el origen. Vamos $\hat{y}$, $b_g$, $s^2(g)$ y $s^2(y)$ ser la estimación de $y$, $\beta_g$, $\sigma^2(g)$ y $\sigma^2(y)$, respectivamente, desde la intersección $b_{g0} = \overline{y} - b_g \overline{x} = 0$,$\overline{y} = b_g \overline{x}$, se deduce que
\begin{align*} SSR &= \sum (\hat{y} - \overline{y})^2 \\ &= \sum (b_g g_i - \overline{y})^2 \\ &= \sum(b_g g_i - b_g \overline{g})^2 \\ &= b_g^2 \sum (g_i - \overline{g})^2 \\ &= b_g^2 s^2(g)(n-1) \end{align*} \begin{align} r^2 &= \frac{SSR}{SSR + SSE} \notag\\ &= \frac{b_g^2 s^2(g)(n-1)}{b_g^2 s^2(g)(n-1) + s^2(y)(n-1)} \notag\\ &= \frac{b_g^2 s^2(g)}{b_g^2 s^2(g) + s^2(y)} \end{align}.
La ecuación anterior es muy similar a lo que el autor ofrece en su primera ecuación, pero esencialmente diferentes, a menos que el autor ha confundido acerca de la verdadera y cantidades estimadas. La segunda ecuación acerca de $\hat{r^2}_{locus}$ totalmente escapa a mi comprensión, cualquier ayuda será apreciada.