Processing math: 100%

12 votos

Regresión lineal multivariante frente a varios modelos de regresión univariante

En la configuración de la regresión univariante, tratamos de modelar

y=Xβ+noise

donde yRn un vector de n observaciones y XRn×m la matriz de diseño con m predictores. La solución es β0=(XTX)1Xy .

En la configuración de la regresión multivariante, tratamos de modelar

Y=Xβ+noise

donde yRn×p es una matriz de n observaciones y p diferentes variables latentes. La solución es β0=(XTX)1XY .

Mi pregunta es en qué se diferencia eso de realizar p ¿una regresión lineal univariante diferente? Leo aquí que en este último caso se tenga en cuenta la correlación entre las variables dependientes, pero no lo veo por las matemáticas.

1 votos

Véase el teorema de Frisch-Waugh-Lovell.

1 votos

@amorfati: Entonces, si entiendo bien, son lo mismo. Por qué la gente los trata de forma diferente?

7voto

throwaway Puntos 18

En el entorno de la regresión lineal multivariante clásica, tenemos el modelo

Y=Xβ+ϵ

donde X representa las variables independientes, Y representa variables de respuesta múltiples, y ϵ es un término de ruido gaussiano i.i.d. El ruido tiene media cero y puede estar correlacionado entre las variables de respuesta. La solución de máxima verosimilitud para los pesos es equivalente a la solución de mínimos cuadrados (independientemente de las correlaciones de ruido) [1][2]:

ˆβ=(XTX)1XTY

Esto equivale a resolver independientemente un problema de regresión para cada variable de respuesta. Esto puede verse en el hecho de que el i columna de ˆβ (que contiene los pesos para el i de la variable de salida) se puede obtener multiplicando (XTX)1XT por el i columna de Y (que contiene los valores del i de la variable de respuesta).

Sin embargo, la regresión lineal multivariante difiere de la resolución por separado de los problemas de regresión individuales porque los procedimientos de inferencia estadística tienen en cuenta las correlaciones entre las múltiples variables de respuesta (por ejemplo, véase [2],[3],[4]). Por ejemplo, la matriz de covarianza del ruido aparece en las distribuciones de muestreo, los estadísticos de prueba y las estimaciones de intervalo.

Otra diferencia surge si permitimos que cada variable de respuesta tenga su propio conjunto de covariables:

Yi=Xiβi+ϵi

donde Yi representa el i la variable de respuesta, y Xi y ϵi representa su correspondiente conjunto de covariables y término de ruido. Como en el caso anterior, los términos de ruido pueden estar correlacionados entre las variables de respuesta. En este entorno, existen estimadores que son más eficientes que los mínimos cuadrados, y no pueden reducirse a resolver problemas de regresión separados para cada variable de respuesta. Por ejemplo, véase [1].

Referencias

  1. Zellner (1962) . Un método eficiente para estimar regresiones aparentemente no relacionadas y pruebas de sesgo de agregación.
  2. Helwig (2017) . Regresión lineal multivariante [Diapositivas]
  3. Fox y Weisberg (2011) . Multivariate linear models in R. [Appendix to: An R Companion to Applied Regression].
  4. Maitra (2013) . Modelos de regresión lineal multivariante. [Diapositivas]

1 votos

Gracias, ahora está más claro. ¿Tienes una referencia para esta formulación? Sólo he encontrado la forma de mínimos cuadrados. Además, ¿conoces algún paquete de Python que lo implemente?

1 votos

Secundo la solicitud de referencia. ¿Se toma la correlación como la covarianza de los resultados, o se aprende algún tipo de covarianza condicional?

0 votos

No estoy 100% seguro de que @user20160 se refiriera a estas pero creo que lo que tenía en mente eran ecuaciones de estimación/ecuaciones de estimación generalizadas. EE/GEE son consistentes cuando la estructura de covarianza está mal especificada y también se puede establecer la estructura de covarianza esperada. Sin embargo, estos modelos se estiman de forma iterativa, a diferencia de los MCO con una forma cerrada. Debería poder estimar GEE/EE en Python, pero no conozco los paquetes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X