20 votos

Utilidad del teorema de Frisch-Waugh

Se supone que debo enseñar el teorema de Frish Waugh en econometría, que no he estudiado.

He entendido las matemáticas que hay detrás y espero que la idea también "el coeficiente que se obtiene para un coeficiente concreto de un modelo lineal múltiple es igual al coeficiente del modelo de regresión simple si se "elimina" la influencia de los otros regresores". Así que la idea teórica está bien. (Si lo he entendido mal, agradeceré una corrección)

Pero, ¿tiene algún uso clásico/práctico?

EDITAR : He aceptado una respuesta, pero todavía estoy dispuesto a tener nuevas que aporten otros ejemplos/aplicaciones.

4 votos

Una obviedad sería añadir parcelas variables ?

1 votos

Dougherty's Introducción a la econometría menciona otro ejemplo de uso del teorema de Frisch-Waugh-Lovell. En los primeros tiempos del análisis econométrico de las series temporales, era bastante común en los modelos en los que las variables tenían tendencias temporales deterministas, que se les quitara la tendencia a todas ellas antes de hacer la regresión. Pero mediante el FWL, se obtienen los mismos coeficientes simplemente incluyendo una tendencia temporal como regresor, y además esto da los errores estándar "correctos", ya que reconoce que se ha consumido 1 df.

1 votos

Dougherty advierte sobre el procedimiento, así que en ese sentido no es un gran ejemplo, aunque sea instructivo. Las variables económicas a menudo parecen ser estacionarias por diferencia en lugar de estacionarias por tendencia, por lo que este tipo de intento de pérdida de tendencia no funciona y puede dar lugar a regresiones espurias.

16voto

Christoph Hanck Puntos 4143

Consideremos el modelo de datos de panel de efectos fijos, también conocido como modelo de variables ficticias de mínimos cuadrados (LSDV).

$b_{LSDV}$ puede calcularse aplicando directamente OLS al modelo $$y=X\beta+D\alpha+\epsilon,$$ donde $D$ es un $NT\times N$ matriz de dummies y $\alpha$ representan los efectos fijos específicos del individuo.

Otra forma de calcular $b_{LSDV}$ es aplicar el llamado dentro de la transformación al modelo habitual para obtener una versión degradada del mismo, es decir $$M_{[D]}y=M_{[D]}X\beta+M_{[D]}\epsilon.$$ Aquí, $M_{[D]}=I-D(D'D)^{-1}D'$ la matriz de fabricación de residuos de una regresión sobre $D$ .

Por el teorema de Frisch-Waugh-Lovell, los dos son equivalentes, ya que FWL dice que se puede calcular un subconjunto de coeficientes de regresión de una regresión (aquí, $\hat\beta$ ) por

  1. retrocediendo $y$ en los otros regresores (aquí, $D$ ), guardando los residuos (en este caso, el tiempo-dimensionado $y$ o $M_{[D]}y$ porque la regresión sobre una constante sólo degrada las variables), entonces
  2. retrocediendo el $X$ en $D$ y guardando los residuos $M_{[D]}X$ y
  3. haciendo una regresión de los residuos entre sí, $M_{[D]}y$ en $M_{[D]}X$ .

La segunda versión es mucho más utilizada, porque los conjuntos de datos de panel típicos pueden tener miles de unidades de panel $N$ por lo que la primera aproximación requeriría ejecutar una regresión con miles de regresores, lo que no es una buena idea numéricamente incluso hoy en día con ordenadores rápidos, ya que el cálculo de la inversa de $(D :X)'(D: X)$ sería muy costoso, mientras que la pérdida de tiempo $y$ y $X$ es de poco coste.

0 votos

Muchas gracias, este es el tipo de respuesta que estaba buscando, aunque es un poco avanzado para que lo pueda utilizar realmente. Así que su respuesta está bien para mí, pero sería feliz si tengo otros, se supone que debo aceptar la suya ?

0 votos

Si sirviera de algo, sería apropiado hacerlo. Pero aceptar reducirá tus posibilidades de obtener mejores respuestas, así que puedes considerar esperar antes de aceptar esta. Una recompensa aumentaría aún más sus posibilidades de obtener más respuestas - dado que no hay suficientes usuarios en CV que respondan regularmente a las preguntas dada la cantidad de preguntas, incluso una sola respuesta puede llevar a otros usuarios activos a concluir que las preguntas han sido tratadas. (He publicado una respuesta algo más sencilla a continuación).

9voto

Christoph Hanck Puntos 4143

He aquí una versión simplificada de mi primera respuesta, que creo que es menos relevante desde el punto de vista práctico, pero posiblemente más fácil de "vender" para su uso en el aula.

Las regresiones $$y_i = \beta_1 + \sum_{j=2}^K\beta_jx_{ij} + \epsilon_i$$ y $$y_i-\bar{y} = \sum^K_{j=2}\beta_j(x_{ij} - \bar{x}_j) + \tilde{\epsilon}_i$$ rendimiento idéntico $\widehat{\beta}_j$ , $j=2,\ldots,K$ . Esto se puede ver de la siguiente manera: tomar $\mathbf{x}_1=\mathbf{1}:=(1,\ldots,1)'$ y por lo tanto $$ M_\mathbf{1}=I-\mathbf{1}(\mathbf{1}'\mathbf{1})^{-1}\mathbf{1}'=I-\frac{\mathbf{1}\mathbf{1}'}{n}, $$ para que $$M_{\mathbf{1}}\mathbf{x}_j=\mathbf{x}_j-\mathbf{1} n^{-1}\mathbf{1}'\mathbf{x}_j=\mathbf{x}_j-\mathbf{1}\bar{x}_j=:\mathbf{x}_j-\bar{\mathbf{x}}_j. $$ Por lo tanto, los residuos de una regresión de variables sobre una constante, $M_{\mathbf{1}}\mathbf{x}_j$ son sólo las variables degradadas (la misma lógica, por supuesto, se aplica a $y_i$ ).

4voto

Christoph Hanck Puntos 4143

Aquí hay otra, más indirecta, pero creo que interesante, a saber, la conexión entre diferentes enfoques para calcular el coeficiente de autocorrelación parcial de una serie temporal estacionaria.

Definición 1

Considere la proyección \begin{equation} \hat{Y}_{t}-\mu=\alpha^{(m)}_1(Y_{t-1}-\mu)+\alpha^{(m)}_2(Y_{t-2}-\mu)+\ldots+\alpha^{(m)}_m(Y_{t-m}-\mu) \end{equation} El $m$ th autocorrelación parcial es igual a $\alpha^{(m)}_m$ .

Por lo tanto, da la influencia de la $m$ el retardo en $Y_t$ \Después de controlar por $Y_{t-1},\ldots,Y_{t-m+1}$ . Contrasta esto con $\rho_m$ que da la correlación "pura" de $Y_t$ y $Y_{t-m}$ .

¿Cómo podemos encontrar el $\alpha^{(m)}_j$ ? Recordemos que una propiedad fundamental de una regresión de $Z_t$ sobre los regresores $X_t$ es que los coeficientes son tales que los regresores y los residuos no están correlacionados. En una regresión poblacional esta condición se plantea entonces en términos de correlaciones poblacionales. Entonces: \begin{equation} E[X_t(Z_t-X_t^\top\mathbf{\alpha}^{(m)})]=0 \end{equation} Resolver para $\mathbf{\alpha}^{(m)}$ encontramos el coeficientes de proyección lineal \begin{equation} \mathbf{\alpha}^{(m)}=[E(X_tX_t^\top)]^{-1}E[X_tZ_t] \end{equation} Aplicando esta fórmula a $Z_t=Y_t-\mu$ y $$X_t=[(Y_{t-1}-\mu),(Y_{t-2}-\mu),\ldots,(Y_{t-m}-\mu)]^\top$$ tenemos $$ E(X_tX_t^\top)=\left(\begin{array}{cccc} \gamma_{0} & \gamma_{1}&\cdots& \gamma_{m-1}\\ \gamma_{1}& \gamma_{0} & \cdots &\gamma_{m-2}\\ \vdots & \vdots & \ddots &\vdots\\ \gamma_{m-1}&\gamma_{m-2} & \cdots & \gamma_{0}\\ \end{array} \right) $$ También, $$ E(X_tZ_t)=\left( \begin{array}{c} \gamma_1 \\ \vdots \\ \gamma_m \\ \end{array} \right) $$ Por lo tanto, \begin{equation} \mathbf{\alpha}^{(m)}=\left(\begin{array}{cccc} \gamma_{0} & \gamma_{1}&\cdots& \gamma_{m-1}\\ \gamma_{1}& \gamma_{0} & \cdots &\gamma_{m-2}\\ \vdots & \vdots & \ddots &\vdots\\ \gamma_{m-1}&\gamma_{m-2} & \cdots & \gamma_{0}\\ \end{array} \begin{array}{c} \gamma_1 \\ \vdots \\ \gamma_m \\ \end{array} \derecha)\Nfinalizar{ecuación} El $m$ La correlación parcial es el último elemento del vector $\mathbf{\alpha}^{(m)}$ .

Así que hacemos una especie de regresión múltiple y encontramos un coeficiente de interés mientras controlamos los demás.

Definición 2

El $m$ La correlación parcial es la correlación del error de predicción de $Y_{t+m}$ predicho con $Y_{t-1},\ldots,Y_{t-m+1}$ con el error de predicción de $Y_{t}$ predicho con $Y_{t-1},\ldots,Y_{t-m+1}$ .

Así, primero controlamos los rezagos intermedios y luego calculamos la correlación de los residuos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X