5 votos

¿Cuáles son las diferencias entre las pruebas de sobreidentificación en 2SLS

Estoy utilizando 2SLS para mi investigación y quiero comprobar si hay sobreidentificación. Empecé con la prueba de Hausman, que conozco bastante bien.

El problema que tengo es que con la prueba de Hausman y la de Sargan estoy obteniendo resultados muy diferentes.

La prueba de Sargan se realiza mediante ivmodel de library(ivmodel) . Copié la prueba de Hausman de "Using R for Introductory Econometrics" página 226, de Florian Heiss.

[1] "############################################################"
[1] "***Hausman Test for Overidentification***"
[1] "############################################################"
[1] "***R2***"
[1] 0.0031
[1] "***Number of observations (nobs)***"
[1] 8937
[1] "***nobs*R2***"
[1] 28
[1] "***p-value***"
[1] 0.00000015

Sargan Test Result:

Sargan Test Statistics=0.31, df=1, p-value is 0.6

Además, también estoy utilizando ivtobit de Stata, que proporciona una prueba de Wald de exogeneidad.

Por último he leído sobre un cuarto que es el Hansen J statistic .

¿Cuál es la diferencia entre todas estas pruebas?

12voto

blembo Puntos 3

Aquí hay muchas preguntas, así que primero daré una visión general y luego explicaré un poco más. Usted tiene 4 pruebas que usted está pidiendo acerca de: Prueba de Hausman, prueba de Sargan, una prueba de Wald de exogeneidad, y una prueba de Hansen J. Para fijar un poco la notación, dejemos que $Z$ sea un vector de instrumentos, y considere $Y = \beta_1 X_1 + \beta_2 X_2 + e$ donde $X_1$ son variables exógenas que se incluyen en el modelo, y $X_2$ son endógenos, y desea utilizar $Z$ instrumentos para $X_2$ . A veces utilizaré $X = (X_1,X_2)$ también. A continuación, describiré cada una de las pruebas y, después, ofreceré una intuición y un enfoque. Puede que me desvíe de mi notación durante las partes de intuición, pero he intentado ceñirme a ella durante las partes de enfoque.

Antes de empezar, el TL;DR es que Wald y Hausmann prueban la exogeneidad de $X$ (suponiendo la exogeneidad de $Z$ ), y la prueba J de Hansen y Sargan para la exogeneidad de $Z$ (suponiendo que tenga más instrumentos que variables endógenas). Wald y Hausmann son muy similares, pero Wald suele ser mejor que Hausmann, y Sargan es una versión más simple de la J de Hansen que se utiliza con TSLS (la J de Hansen se utiliza con IV-GMM). Dado que Hausman y Sargan prueban cosas diferentes, es lógico que se obtengan resultados distintos.

He aquí una explicación de lo que hace básicamente cada prueba:

Prueba de exogeneidad de Wald : Usted supone que los instrumentos $Z$ satisfacen la exogeneidad, y se comprueba si $X_2$ puede ser en realidad exógena.

Intuición: Usted tiene un instrumento válido $Z$ (esta suposición es clave) para alguna variable $X$ y la primera etapa se ajusta básicamente $X = \hat{\alpha} Z + \hat{e}$ e intuitivamente, en TSLS, sustituimos $X$ con $\hat{\alpha}Z$ en la segunda etapa, que es la parte de $X$ que se predice mediante $Z$ . ¿Qué es $\hat{e}$ ? Bueno, es la parte de $X$ que no se explica por $Z$ . Si realizamos una regresión de $Y$ en $\hat{e}$ . y encontrar $\hat{e}$ no tiene ningún efecto sobre $Y$ entonces la parte de $X$ que explica $Y$ se explica básicamente por $\hat{\alpha}Z$ pero como $Z$ es exógena por hipótesis, entonces $X$ sobre $Y$ es una combinación del $Z$ pieza montada y la $Z$ parte no ajustada, pero acabamos de descubrir que la parte no ajustada no importa, y por lo tanto $X$ es en realidad exógena a todos los efectos: la única parte de ella que importa es la explicada por $Z$ y $Z$ es exógena, por lo que $X$ debe ser exógena. En tal caso, no es necesario utilizar IV y basta con aplicar OLS, que es más eficiente.

Planteamiento: realizamos la regresión $Y = \delta_1 X + \delta_2\text{resid}(X_2) + \epsilon$ donde $\text{resid}(X_2)$ son los residuos de la regresión de primera etapa de $X_2$ en $Z$ . Entonces la prueba de exogeneidad es una prueba de Wald que $\delta_2 = 0$ (es decir, probar conjuntamente que todos los coeficientes del vector $\delta_2$ son $0$ ). Rechazar la prueba significa que $X_2$ es no exógeno.

Prueba de endogeneidad de Hausman : Esta prueba es muy similar a la prueba de Wald anterior, y debería ser bastante similar (creo que exactamente la misma) bajo homocedasticidad. No se utiliza porque no queremos imponer necesariamente tal supuesto, y porque implica una inversión generalizada de una matriz que a menudo es difícil de calcular numéricamente. Así que en su lugar utilizamos una prueba de Wald como la anterior.

Intuición: Igual que la prueba de Wald anterior.

Enfoque: Primero obtenga la primera etapa de TSLS y obtenga los residuos $r$ . A continuación, ejecute una regresión $Y = \beta X + \delta r$ y comprobar si $\delta = 0$ . Si es significativamente diferente, $(X_1,X_2)$ no es exógena, y debe utilizar TSLS, de lo contrario puede utilizar el más eficiente OLS. Tenga en cuenta que, a diferencia de la prueba de Wald, la primera etapa y los residuos son para todos los $(X_1,X_2)$ utilizando $(X_1,Z)$ no sólo $X_2$ .

Hansen's J : Si tenemos más instrumentos que variables endógenas, es decir $dim(Z) > dim(X_2)$ entonces podemos probar si todos los instrumentos son exógenos asumiendo que al menos uno de ellos es exógeno.

Intuición: Si $dim(Z) > dim(X_2)$ Tenemos más instrumentos de los que necesitamos, por lo que podemos utilizar algunos de ellos con fines de prueba en lugar de utilizarlos para la estimación. No estoy muy seguro de cómo dar una explicación intuitiva aquí, pero básicamente si tenemos más instrumentos de los necesarios, TSLS utilizará todos estos instrumentos para construir un conjunto de instrumentos de $dim(X_2)$ por lo que puedo tomar los residuos del TSLS utilizando este conjunto "reducido" de instrumentos y, a continuación, realizar una regresión de estos residuos (denominada $r_{TSLS}$ ) en $Z$ . Si $dim(Z) = dim(X_2)$ entonces, por construcción, el coeficiente de dicha regresión será $0$ es decir $r_{TSLS} = \hat{\alpha}Z$ siempre dará como resultado $\hat{\alpha} = 0$ y así no aprendemos nada. Por el contrario, si $dim(Z) > dim(X_2)$ entonces no tiene por qué ser así, pero si los instrumentos fueran realmente exógenos, entonces debería seguir siendo $0$ . Esto es lo que estamos probando aquí.

Enfoque: Esto se utiliza realmente con IV-GMM, que no es lo que estás haciendo, así que no sé cuánto quieres saber sobre esto. Como explicaré a continuación, la prueba de Sargan es básicamente la versión simplificada de esta prueba utilizada con TSLS (la analogía suele ser la siguiente: IV es a GMM como la prueba de Sargan es a la prueba J de Hansen).

Sargan : Muy similar a la J de Hansen. La utilizamos para comprobar la exogeneidad de los instrumentos asumiendo que uno es al menos exógeno, cuando tenemos más instrumentos que $X_2$ variables endógenas. Es popular cuando se realiza TSLS. Siguiendo el comentario que figura a continuación, parece que la prueba de Hausmann para la sobreidentificación, definida por OP en la Sección 15.5 de Wooldridge's Introductory Econometrics, también se define como esta prueba.

Intuición: Igual que la J de Hansen.

Enfoque: Si asumimos homocedasticidad, la prueba de Sargan es un caso especial de la prueba J de Hansen. Primero ejecutamos el TSLS con todos los instrumentos, obtenemos los residuos y luego los regresamos sobre los instrumentos. El tamaño de la muestra es $R^2$ de esta regresión es aproximadamente $\chi^2$ con el número de instrumentos sobrantes como grados de libertad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X