13 votos

Regresión y causalidad en la econometría

En la regresión en general y en la regresión lineal en particular, a veces se permite la interpretación causal sobre los parámetros. Al menos en la literatura de la econometría, pero no sólo, cuando se permite la interpretación causal no está tan claro; para una discusión se puede ver: Regresión y causalidad: Un examen crítico de seis libros de texto de Econometría - Chen y Pearl (2013).

Para un manejo adecuado de la causalidad en el modelo estadístico, la mejor manera probablemente sea utilizar el Modelo de Causalidad Estructural como se explica, por ejemplo (brevemente), en Trygve Haavelmo y la aparición del cálculo causal - Pearl 2012 feb.

Sin embargo, en la actualidad, no son el método estándar en el modelo econométrico básico (regresión lineal múltiple clásica). De hecho, se utiliza con frecuencia el concepto de "modelo verdadero" o "proceso de generación de datos" que a veces tienen un significado causal explícito. En cualquier caso, quiero considerar sólo el sentido causal. Por lo tanto, si estimamos la contrapartida de la muestra del "modelo verdadero", obtenemos una interpretación causal sobre los parámetros.

Teniendo en cuenta la consideración anterior, mi intento es comprender

  • el vínculo entre el concepto de "modelo verdadero" (de los actuales libros de texto de econometría) y el modelo causal estructural (de Pearl) si lo hay.

  • El vínculo entre el punto anterior y el concepto de experimento controlado aleatorio como se utiliza en el laboratorio, que a veces es el punto de referencia en el estudio observacional de la econometría ( tan bueno como que). Por ejemplo, Stock y Watson (2013) discuten mucho sobre eso (en particular el capítulo 13). Además, en Pearl 2012feb pag 14 hay una revisión del debate entre "estructuralistas" y "experimentalistas" que está fuertemente relacionada con este punto.

¿Puede explicarme algo sobre estos dos puntos en el escenario más simple posible?

2 votos

Existen múltiples escuelas de pensamiento sobre la causalidad en econometría. Véase, por ejemplo, el comentario de Heckman y Pinto (2015) sobre Pearl, o las aplicaciones del modelo de resultados potenciales de Rubin (por ejemplo, en Mostly Harmless Econometrics, de Angrist y Pischke).

0 votos

No hay modelos "verdaderos" en economía

1 votos

@Frank: gracias por el papel sugerido, seguramente serán útiles. Respecto al libro de Angrist y Pischke, lo he leído. Estudié unos diez libros de texto de econometría y Mostly Harmless Econometrics representa el mejor sobre causalidad (mi opinión, pero probablemente no la única). Aprendí mucho con él. Sin embargo, al menos en mi opinión, incluso este libro es exhaustivo. Por ejemplo, no dice nada sobre el modelo causal estructural y el vínculo entre éste y el lenguaje de resultados potenciales. Por último, no ofrece una respuesta a mis dos preguntas anteriores. O, al menos, yo no la veo.

11voto

ColorStatistics Puntos 110

Una pista. La suma cuadrática de Gauss $S=\sum_{i-1}^{p-1}\left(\frac{i}{p}\right)\zeta_p^i$ satisface $S^2=\left(\frac{-1}{p}\right)p$ , donde $\left(\frac{a}{p}\right)$ es el símbolo de Legendre.

0 votos

Entiendo tu explicación pero me temo que no da respuesta sobre mi pregunta. Excepto, tal vez, la frase final pero estoy parcialmente en desacuerdo con ella. En primer lugar explicas la utilidad de un experimento. Estoy de acuerdo contigo en eso. Después dices que (en breve) en el contexto observacional tenemos que "desenredar de alguna manera el efecto causal del meramente correlativo" sin manipulaciones experimentales. Ya lo sé.

0 votos

Después, ya que la diferencia conceptual entre el condicionamiento y la intervención, se introduce la notación de intervención de Pearl. Entiendo la utilidad de la notación de intervención. No me fío del gráfico causal pero seguro que también es útil. Las aportaciones de Pearl son importantes. Por último, has dicho que: "Pearl llamaría a un modelo con coeficientes causales (efecto directo) como el dado por $E[Y|do(X=x)]$ el modelo causal estructural". De acuerdo, lo entiendo.

1 votos

" regresiones en las que los coeficientes vienen dados por $E[Y|X]$ es lo que, según él, los autores llaman erróneamente "modelo verdadero", es decir, cuando buscan estimar el efecto causal de $X$ en $Y$ y no sólo para pronosticar $Y$ ." Esto me parece que no es estrictamente cierto porque $E[Y|X]$ no siempre es el verdadero modelo. Cualquier regresión OLS es una expectativa condicional, pero no todas ellas son la contrapartida del verdadero modelo que se utiliza con frecuencia en los libros de texto de econometría.

7voto

Ochado Puntos 43

En el contexto del documento de Pearl que has dado, lo que la mayoría de los econometristas llamarían un modelo real es la entrada I-1 al Modelo Causal Estructural: un conjunto de supuestos $A$ y un modelo $M_A$ que codifica estos supuestos, escrito como un sistema de ecuaciones estructurales (como en los modelos 1 y 2) y una lista de supuestos estadísticos que relacionan las variables. En general, el modelo verdadero no tiene por qué ser recursivo, por lo que el gráfico correspondiente puede tener ciclos.

¿Cuál es un ejemplo de un verdadero modelo? Consideremos la relación entre la escolaridad y los ingresos, descrita en Angrist y Pischke (2009), sección 3.2. Para el individuo $i$ lo que los econometristas llamarían el modelo real es una función supuesta que mapea cualquier nivel de escolaridad $s$ a un resultado $y_{si}$ : $$ y_{si} = f_i(s). $$ Este es exactamente el resultado potencial. Se podría ir más allá y asumir una forma funcional paramétrica para $f_i(s)$ . Por ejemplo, el modelo causal de efectos constantes lineales: $$ f_i(s) = \alpha + \rho s + \eta_i. $$ Aquí, $\alpha$ y $\rho$ son parámetros no observados. Al escribirlo de esta manera, asumimos que $\eta_i$ no depende de $s$ . En el lenguaje de Pearl, esto nos dice lo que ocurre con los ingresos esperados si fijamos la escolaridad de un individuo en $s_i = s_0$ pero no observamos $\eta_i$ : $$ E[y_{si} \mid do(s_i = s_0)] = E[f_i(s_0)] = \alpha + \rho s_0 + E[\eta_i]. $$ No hemos dicho qué consultas nos interesan, ni qué datos tenemos. Así que el "modelo verdadero" no es un MEC completo. (Esto es generalmente cierto, no sólo en este ejemplo).

¿Qué relación hay entre un modelo real y un experimento aleatorio? Supongamos que un econometrista quiere estimar $\rho$ . Sólo observando $(s_i, y_i)$ para un grupo de individuos no es suficiente. Esto es idéntico al punto de Pearl sobre el condicionamiento estadístico. Aquí $$ E[y_{si} \mid s_i = s_0] = E[f_i(s_0) \mid s_i = s_0] = \alpha + \rho s_0 + E[\eta_i \mid s_i = s_0]. $$ Como señalan Angrist y Pischke $\eta_i$ puede estar correlacionada con $s_i$ en los datos observacionales, debido al sesgo de selección: la decisión de un individuo sobre la escolarización podría depender de su valor de $\eta_i$ .

Los experimentos aleatorios son una forma de corregir esta correlación. Utilizando la notación de Pearl de forma imprecisa, si asignamos aleatoriamente a nuestros sujetos a $do(s_i = s_0)$ y $do(s_i = s_1)$ entonces podemos estimar $E[y_{si} \mid do(s_i = s_1)]$ y $E[y_{si} \mid do(s_i = s_0)]$ . Entonces $\rho$ está dada por: $$ E[y_{si} \mid do(s_i = s_1)] - E[y_{si} \mid do(s_i = s_0)] = \rho(s_1 - s_0). $$

Con suposiciones y datos adicionales, hay otras formas de corregir la correlación. Un experimento aleatorio sólo se considera el "mejor" porque puede que no creamos los otros supuestos. Por ejemplo, con el supuesto de independencia condicional y datos adicionales, podríamos estimar $\rho$ por OLS; o podríamos introducir variables instrumentales.

Editar : Me temo que su pregunta falsea la práctica habitual de la econometría, en particular esta afirmación:

Por lo tanto, si estimamos la contrapartida muestral del "modelo verdadero" conseguimos una interpretación causal sobre los parámetros.

Ningún econometrista trataría de estimar $y_i = \alpha + \rho s_i + \eta_i$ en datos observacionales, bajo los supuestos dados, porque no hay forma válida de hacerlo. OLS requeriría que $E[ \eta_i s_i ] = 0$ pero $\eta_i$ y $s_i$ pueden estar correlacionados.

Edición 2 (CIA) : Este es un punto principalmente filosófico, y Angrist y Pischke pueden estar en desacuerdo con mi presentación aquí. El supuesto de independencia condicional (selección de observables) nos permite corregir el sesgo de selección. Añade un supuesto sobre las distribuciones conjuntas: que $$ f_i(s) \perp\!\!\!\perp s_i \mid X_i $$ para todos $s$ . Utilizando sólo el álgebra de expectativas condicionales (véase la derivación en Angrist y Pischke) se deduce que podemos escribir $$ y_i = f_i(s_i) = \alpha + \rho s_i + X_i' \gamma + v_i $$ con $E[v_i \mid X_i, s_i] = 0$ . Esta ecuación nos permite estimar $\rho$ en los datos utilizando OLS.

Ni la aleatoriedad ni el CIA entran en el sistema de ecuaciones que define el modelo verdadero. Son supuestos estadísticos que nos dan formas de estimar los parámetros de un modelo que ya hemos definido, utilizando los datos que tenemos. Los econometristas no suelen considerar la CIA como parte del modelo verdadero, pero Pearl la incluiría en $A$ .

0 votos

Ya veo el ejemplo de Angrist y Pischke y lo he pensado. Ese fue el mejor ejemplo/explicación que nunca encontré. Su adición representa lo que estaba buscando. Gracias.

0 votos

Sin embargo, permítanme añadir algunos puntos y preguntas específicas. Angrist y Pischke denominan el modelo como "modelo causal de efecto constante lineal", pero mi duda era exactamente si ese modelo era interpretable como el "modelo verdadero" que suelo ver en muchos libros de texto de econometría (para un ejemplo sencillo, véase mi comentario sobre la respuesta de ColorStatistics). Mi respuesta preferida fue que no, porque en el "modelo verdadero" habitual es explícitamente válida alguna forma de exogeneidad que, de hecho, se viola precisamente en el presente caso. Esta es exactamente su consideración final sobre mi frase, pero yo era consciente de este problema.

0 votos

Ahora bien, Angrist y Pischke nunca hablan de "modelo verdadero", pero usted sugiere esta interpretación para ello. Probablemente tengas razón. En cualquier caso, escribes: "Así que el "modelo verdadero" es sólo una parte del MEC". ¡Bien! Tu es una forma bien planteada de una conjetura que ya tenía en mente. ¿Esta conclusión se mantiene incluso en el caso del "modelo verdadero" que yo recordaba antes?

-1voto

HEITZ Puntos 164

En mi opinión, el uso del término "causal" en estos enfoques basados en la regresión/correlación es engañoso. El análisis de trayectorias, la modelización de ecuaciones estructurales, la causalidad de Granger, etc., intentan autorizar las inferencias causales imponiendo algunos supuestos bastante tenues. En el caso de la modelización de ecuaciones estructurales, por ejemplo, las trayectorias son direccionales y A parece ser la "causa" de B, pero esto significa simplemente que el modelo, tal y como está estructurado, es "plausible" en el sentido de que reproduce una matriz de covarianza observada (de hecho, la dirección de las trayectorias ni siquiera importa mucho, sólo las restricciones).

0 votos

Usted escribe: "En el caso de la modelización de ecuaciones estructurales, por ejemplo, las trayectorias son direccionales y A parece "causar" B, pero esto significa simplemente que el modelo, tal como está estructurado, es "plausible" en el sentido de que reproduce una matriz de covarianza observada" No estoy de acuerdo. La ecuación estructural no tiene la función de "reproducir" ninguna cantidad estadística. Además esta cuestión es bastante antigua. Los puntos principales no son más oscuros para mí. He resumido los puntos principales aquí: stats.stackexchange.com/questions/493211/

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X