Processing math: 100%

69 votos

Cómo derivar la matriz de varianza-covarianza de coeficientes en regresión lineal

Estoy leyendo un libro sobre regresión lineal y tengo dificultades para entender la matriz de varianza-covarianza de b:

enter image description here

Los elementos diagonales son lo suficientemente fáciles, pero los que no están en la diagonal son un poco más difíciles, lo que me desconcierta es que σ(b0,b1)=E(b0b1)E(b0)E(b1)=E(b0b1)β0β1

pero aquí no hay rastro de β0 y $\beta_1.

3 votos

2 votos

¿Cuál es el libro?

0 votos

Neter et al., Modelos de regresión lineal aplicados, 1983, página 216. Puedes encontrar el mismo material en Modelos estadísticos lineales aplicados, 5ta edición, página 207.

91voto

Majte Puntos 847

Esta es en realidad una pregunta interesante que desafía tu comprensión básica de una regresión.

Primero aclaremos cualquier confusión inicial sobre la notación. Estamos viendo la regresión:

y=b0+b1x+ˆu

donde b0 y b1 son los estimadores del verdadero β0 y β1, y ˆu son los residuos de la regresión. Ten en cuenta que la verdadera regresión subyacente y no observada se denota así:

y=β0+β1x+u

Con la expectativa de que E[u]=0 y la varianza E[u2]=σ2. Algunos libros denotan b como ˆβ y nosotros adoptamos esta convención aquí. También hacemos uso de la notación matricial, donde b es el vector 2x1 que contiene los estimadores de β=[β0,β1], es decir, b=[b0,b1]. (También para mayor claridad trato a X como fija en los cálculos siguientes.)

Ahora a tu pregunta. Tu fórmula para la covarianza es de hecho correcta, es decir:

σ(b0,b1)=E(b0b1)E(b0)E(b1)=E(b0b1)β0β1

Creo que quieres saber cómo es que tenemos los verdaderos coeficientes no observados β0,β1 en esta fórmula? En realidad se cancelan si llevamos un paso más allá expandiendo la fórmula. Para ver esto, nota que la varianza poblacional del estimador se da por:

Var(ˆβ)=σ2(XX)1

Esta matriz contiene las varianzas en los elementos diagonales y las covarianzas en los elementos fuera de la diagonal.

Para llegar a la fórmula anterior, generalicemos tu afirmación usando notación matricial. Por lo tanto, denotemos varianza con Var[] y expectativa con E[].

Var[b]=E[b2]E[b]E[b]

Essencialmente tenemos la fórmula general de varianza, solo que usando notación matricial. La ecuación se resuelve al sustituir en la expresión estándar para el estimador b=(XX)1Xy. También asumimos E[b]=β como un estimador imparcial. Por lo tanto, obtenemos:

E[((XX)1Xy)2]β22×2

Nota que en el lado derecho tenemos β2 - matriz 2x2, es decir bb, pero probablemente puedas adivinar qué sucederá con este término en breve.

Reemplazando y con nuestra expresión para el verdadero proceso de generación de datos subyacente arriba, tenemos:

E[((XX)1Xy)2]β2=E[((XX)1X(Xβ+u))2]β2=E[((XX)1XX=Iβ+(XX)1Xu)2]β2=E[(β+(XX)1Xu)2]β2=β2+E[(XX)1Xu)2]β2

dado que E[u]=0. Además, el término cuadrático β2 se cancela como se esperaba.

Por lo tanto tenemos:

Var[b]=((XX)1X)2E[u2]

Por linealidad de las expectativas. Nota que por suposición E[u2]=σ2 y ((XX)1X)2=(XX)1XX(XX)1=(XX)1 ya que XX es una matriz simétrica de K×K y por lo tanto la misma que su transpuesta. Finalmente llegamos a

Var[b]=σ2(XX)1

Nota que nos hemos deshecho de todos los términos de β. Intuitivamente, la varianza del estimador es independiente del valor del verdadero coeficiente subyacente, ya que este no es una variable aleatoria en sí misma. El resultado es válido para todos los elementos individuales en la matriz de varianza-covarianza como se muestra en el libro, por lo tanto también es válido para los elementos fuera de la diagonal así como para β0β1 para cancelarse respectivamente. El único problema fue que aplicaste la fórmula general para la varianza que inicialmente no refleja esta cancelación.

En última instancia, la varianza de los coeficientes se reduce a σ2(XX)1 e independiente de β. ¿Pero qué significa esto? (Creo que también preguntaste por una comprensión más general de la matriz de covarianza general)

Mira la fórmula en el libro. Simplemente afirma que la varianza del estimador aumenta cuando el término de error subyacente verdadero es más ruidoso (σ2 aumenta), pero disminuye cuando la dispersión de X aumenta — porque tener observaciones más dispersas alrededor del valor verdadero te permite en general construir un estimador más preciso y por lo tanto más cercano al verdadero β. Por otro lado, los términos de covarianza en la diagonal juegan un papel práctico en la prueba de hipótesis conjuntas como b0=b1=0. Aparte de eso, son un poco ambiguos, en realidad. Espero que esto aclare todas las preguntas.

0 votos

Y cuando mantenga la propagación constante y disminuya las x, el error estándar de la intercepción se vuelve más pequeño, lo cual tiene sentido.

0 votos

No sigo la expansión del cuadrado. ¿Por qué no se simplifica a ((XX)1X)2=((XX)1X)((XX)1X)=X2?

0 votos

Todas las 2 aquí deberían ser transpuestas.

6voto

Marc-Andre R. Puntos 789

En tu caso tenemos

XX=[nXiXiX2i]

Invierte esta matriz y obtendrás el resultado deseado.

0 votos

¿Por qué funciona esto? ¿Puedes decir más?

5voto

Vincent Tang Puntos 101

Solución de máxima verosimilitud:

L(β0,β1|σ,ϵ1,,ϵn)=ni=11σ2πexp[ϵ2i2σ2], donde ϵi=β0+β1xiyi

LL(β0,β1|σ,x1,y1,,xn,yn)=ni=1ln[1σ2π](β0+β1xiyi)22σ2

Estimación de la matriz de covarianza de los coeficientes de regresión a partir de la información de Fisher:

[s[β0]2s[β0,β1]s[β0,β1]s[β1]2]=H1=[2LLβ202LLβ0β12LLβ0β12LLβ21]1=1σ2[nni=1xini=1xini=1x2i]1=[σ2ni=1x2inni=1(x2iˉx2)σ2ˉxni=1(x2iˉx2)σ2ˉxni=1(x2iˉx2)σ2ni=1(x2iˉx2)]

2voto

Gyongyeee Puntos 38

Parece que β0β1 son los valores predichos (valores esperados). Hacen el cambio entre E(b0)=β0 y E(b1)=β1.

0 votos

β0 y β1 son generalmente desconocidos, ¿a qué pueden cambiar?

0 votos

Creo que entiendo la confusión, y creo que tal vez deberían haber escrito β0 en lugar de β0. Aquí hay otro post que pasa por el cálculo: enlace

4 votos

@qed: para obtener estimaciones de muestra de las cantidades desconocidas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X