Processing math: 100%

4 votos

Encontrar la suma residual de los cuadrados

Deje que Y1,Y2,Y3 sean variables aleatorias no correlacionadas con varianza común σ2>0 tal que
E[Y1]=β1+β2,E[Y2]=2β1,E[Y3]=β1β2 donde β1 y β2 son parámetros desconocidos. Encuentre la suma residual de cuadrados bajo el modelo lineal anterior. Procedo de la siguiente manera:

Nota que: E[Y1β1β2]=0,V[Y1β1β2]=σ2,E[Y22β1]=0,V[Y22β1]=σ2,E[Y3β1+β2]=0,V[Y3β1+β2]=σ2 Entonces, la suma residual de cuadrados bajo el modelo lineal anterior es: e2i=(Y1β1β2)2+(Y22β1)2+(Y3β1+β2)2 ¿Estoy procediendo de la manera correcta? ¿Alguien puede explicar qué se quiere decir con modelo lineal aquí?

2voto

Tyson Phalp Puntos 156

Su modelo debe ser reescrito como una ecuación de estimación de la forma Y=Xθ+ϵ donde y1,y2,y3 son simplemente la misma variable observada en diferentes grupos (o clústeres)

Eso implica: yi=θ1D1i+θ2D2i+θ3D3i+ϵi Donde Dki es una variable dummy que =1 si la i-ésima observación corresponde al k-ésimo grupo. Así θ1=β1+β2 θ2=2β1 θ3=β1β2. Pero estimar las ecuaciones anteriores daría como resultado 3 parámetros θ de los cuales solo existen 2 β por lo que el sistema está sobredeterminado. Sería más razonable escribir θ3 como:

θ3=θ2θ1 así la ecuación de estimación se convierte en:

yi=θ1(D1iD3i)+θ2(D2i+D3i)+ϵiθ1x1i+θ2x2i+ϵi

que es una regresión lineal estándar con 2 variables explicativas. Una vez que el modelo es estimado (ˆθ), la suma de los residuos al cuadrado es

iˆϵ2i=iy2i2iyiˆyi+ˆy2i

El primer término se obtiene como (Y1i+Y2i+Y3i)2. Desarrollando el segundo término se obtiene :

2(ˆθ1iyix1i+ˆθ2yix2i) 2(ˆθ1(iY1iY3i)+ˆθ2(Y2iY3i))

mientras que el tercero es:

$\hat\theta_1^2\sum_ix_{1i}^2 +\hat\theta_2^2\sum_ix_{2i}^2+2\hat\theta_1\hat\theta_2\sum_i{x_{1i}x_{2i}} donde las sumas son sencillas de calcular siguiendo el álgebra del segundo término.

Pero ¿Qué hay de los valores de ˆθ ? Es fácil. Consideremos las observaciones del primer grupo, la ecuación se convierte en, yi=Y1i=θ1+ϵi, la segunda: Y2i=θ2+ϵi y la tercera: Y3i=yi=θ2θ1+ϵi

Estas 3 ecuaciones son mutuamente excluyentes ya que se basan en muestras diferentes, por lo que estimar la primera y la segunda (por OLS, ML, etc.) implica que los θ estimados son solo promedios de los Yk correspondientes:

ˆθ1=¯Y1, y ˆθ2=¯Y2 y por lo tanto ˆθ3=ˉY2¯Y1

1voto

mat_geek Puntos 1367

No recuerdo haber encontrado este problema antes, pero matemáticamente has interpretado correctamente las suposiciones. Ahora, el siguiente paso es estimar los 2 betas. ¿Cómo se debería hacer eso? Todo lo que está claro a partir del enunciado del problema es que los términos de error estarían descorrelacionados por implicación y tendrían la misma varianza. Pero no está claro (1) si tienen la misma distribución y (2) si esa distribución sería normal. Si los términos de error son normales, serán iid con media 0 y varianza común. Entonces podrías aplicar mínimos cuadrados a la fórmula que tienes para la suma de cuadrados de errores. Si los términos de error son muy no normales pero tienen la misma distribución, se puede utilizar un procedimiento de ajuste robusto como el mínimo de la suma de desviaciones absolutas. Ten en cuenta que los residuos no correlacionados no son necesariamente independientes en situaciones no normales.

Esto se llama un modelo lineal o más correctamente un modelo lineal multivariado porque las variables de respuesta Y1, Y2 y Y3 son todas funciones lineales de los parámetros.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X