6 votos

$\text{Var}(y)$ en la regresión lineal

En la regresión lineal, ¿por qué $\text{Var}(y)$ ¿diferente?

$$\text{Var}(y) = \sigma^2$$

Pero alguien dice que debería ser así. ¿Qué?

$$\text{Var}(y) = \beta_1^2 \text{Var}(x) + \sigma^2$$

10voto

ssn Puntos 472

Desde $y_i \sim \mathcal N(\beta_0+\beta_1x_i,\sigma^2 )$ la varianza de cada muestra $y_i$ est $\sigma^2$ . Se trata de una variante condicional, $\operatorname{Var}(y|x)$ .

La varianza de todas las muestras $y$ es una varianza marginal. Viene dada por las fórmulas comunes $$\operatorname{Var}(y) =\mathbb E\left[y^2\right]- E\left[y\right]^2 =\mathbb E\left[(y-\mathbb E\left[y\right])^2\right] $$

Si $y = \beta_0+\beta_1x+\epsilon$ podemos utilizar las identidades de varianza y el hecho de que $\operatorname{Cov}(x,\epsilon)=0$ para demostrarlo:

$$\operatorname{Var}(y)=\operatorname{Var}(\beta_0+\beta_1x+\epsilon)\\ =\operatorname{Var}(\beta_1x)+\color{blue}{\operatorname{Var}(\epsilon)}+2\operatorname{Cov}(\beta_1x,\epsilon)\\ =\beta_1^2\operatorname{Var}(x)+\color{blue}{\sigma^2}+2\beta_1\color{red}{\operatorname{Cov}(x,\epsilon)}\\ =\beta_1^2\operatorname{Var}(x)+\sigma^2 $$

Por lo tanto, ambos son correctos, pero se refieren a cosas diferentes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X