5 votos

Aproximación de la varianza explicada

Estoy leyendo un libro sobre el "multi-SNP" los datos de GWAS método de análisis, El autor dispone de un modelo lineal $y = \beta_g g + \epsilon$ donde $g$ es un genotipo vector por un solo gen, $\beta_g$ es el verdadero coeficiente de regresión, $\epsilon$ es el error, suponiendo que la línea de regresión pasa por el origen. Vamos $\hat{y}$, $b_g$, $s^2(g)$ y $s^2(y)$ ser la estimación de $y$, $\beta_g$, $\sigma^2(g)$ y $\sigma^2(y)$, respectivamente, desde la intersección $b_{g0} = \overline{y} - b_g \overline{x} = 0$,$\overline{y} = b_g \overline{x}$, se deduce que

\begin{align*} SSR &= \sum (\hat{y} - \overline{y})^2 \\ &= \sum (b_g g_i - \overline{y})^2 \\ &= \sum(b_g g_i - b_g \overline{g})^2 \\ &= b_g^2 \sum (g_i - \overline{g})^2 \\ &= b_g^2 s^2(g)(n-1) \end{align*} \begin{align} r^2 &= \frac{SSR}{SSR + SSE} \notag\\ &= \frac{b_g^2 s^2(g)(n-1)}{b_g^2 s^2(g)(n-1) + s^2(y)(n-1)} \notag\\ &= \frac{b_g^2 s^2(g)}{b_g^2 s^2(g) + s^2(y)} \end{align}.

La ecuación anterior es muy similar a lo que el autor ofrece en su primera ecuación, pero esencialmente diferentes, a menos que el autor ha confundido acerca de la verdadera y cantidades estimadas. La segunda ecuación acerca de $\hat{r^2}_{locus}$ totalmente escapa a mi comprensión, cualquier ayuda será apreciada.

El artículo original se puede encontrar aquí

enter image description here

1voto

Manos Dilaverakis Puntos 202

Esta pregunta se ha publicado aquí durante mucho tiempo y no ha sido contestada incluso con una recompensa de 50 puntos. Después de un segundo pensamiento, parece que la segunda ecuación es usando la versión ajustada de $r^2$: $$ r ^ 2 = 1 - \frac{SSE/df_e}{SST/df_t} $$

En este caso, $\frac{SST}{df_t} = \frac{\sum(y_i - \overline{y})^2}{n-1} = \frac{(n-1)s^2(y)}{n-1} = 1$, ya que todo está estandarizado, y $\frac{SSE}{df_e} = \frac{SSE}{n-m}$, porque no hay ningún término constante en el modelo, finalmente tenemos: $$ r ^ 2 = 1 - \frac{SSE}{n-m} $$

Espero que no he hecho un error.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X