En el contexto del documento de Pearl que has dado, lo que la mayoría de los econometristas llamarían un modelo real es la entrada I-1 al Modelo Causal Estructural: un conjunto de supuestos $A$ y un modelo $M_A$ que codifica estos supuestos, escrito como un sistema de ecuaciones estructurales (como en los modelos 1 y 2) y una lista de supuestos estadísticos que relacionan las variables. En general, el modelo verdadero no tiene por qué ser recursivo, por lo que el gráfico correspondiente puede tener ciclos.
¿Cuál es un ejemplo de un verdadero modelo? Consideremos la relación entre la escolaridad y los ingresos, descrita en Angrist y Pischke (2009), sección 3.2. Para el individuo $i$ lo que los econometristas llamarían el modelo real es una función supuesta que mapea cualquier nivel de escolaridad $s$ a un resultado $y_{si}$ : $$ y_{si} = f_i(s). $$ Este es exactamente el resultado potencial. Se podría ir más allá y asumir una forma funcional paramétrica para $f_i(s)$ . Por ejemplo, el modelo causal de efectos constantes lineales: $$ f_i(s) = \alpha + \rho s + \eta_i. $$ Aquí, $\alpha$ y $\rho$ son parámetros no observados. Al escribirlo de esta manera, asumimos que $\eta_i$ no depende de $s$ . En el lenguaje de Pearl, esto nos dice lo que ocurre con los ingresos esperados si fijamos la escolaridad de un individuo en $s_i = s_0$ pero no observamos $\eta_i$ : $$ E[y_{si} \mid do(s_i = s_0)] = E[f_i(s_0)] = \alpha + \rho s_0 + E[\eta_i]. $$ No hemos dicho qué consultas nos interesan, ni qué datos tenemos. Así que el "modelo verdadero" no es un MEC completo. (Esto es generalmente cierto, no sólo en este ejemplo).
¿Qué relación hay entre un modelo real y un experimento aleatorio? Supongamos que un econometrista quiere estimar $\rho$ . Sólo observando $(s_i, y_i)$ para un grupo de individuos no es suficiente. Esto es idéntico al punto de Pearl sobre el condicionamiento estadístico. Aquí $$ E[y_{si} \mid s_i = s_0] = E[f_i(s_0) \mid s_i = s_0] = \alpha + \rho s_0 + E[\eta_i \mid s_i = s_0]. $$ Como señalan Angrist y Pischke $\eta_i$ puede estar correlacionada con $s_i$ en los datos observacionales, debido al sesgo de selección: la decisión de un individuo sobre la escolarización podría depender de su valor de $\eta_i$ .
Los experimentos aleatorios son una forma de corregir esta correlación. Utilizando la notación de Pearl de forma imprecisa, si asignamos aleatoriamente a nuestros sujetos a $do(s_i = s_0)$ y $do(s_i = s_1)$ entonces podemos estimar $E[y_{si} \mid do(s_i = s_1)]$ y $E[y_{si} \mid do(s_i = s_0)]$ . Entonces $\rho$ está dada por: $$ E[y_{si} \mid do(s_i = s_1)] - E[y_{si} \mid do(s_i = s_0)] = \rho(s_1 - s_0). $$
Con suposiciones y datos adicionales, hay otras formas de corregir la correlación. Un experimento aleatorio sólo se considera el "mejor" porque puede que no creamos los otros supuestos. Por ejemplo, con el supuesto de independencia condicional y datos adicionales, podríamos estimar $\rho$ por OLS; o podríamos introducir variables instrumentales.
Editar : Me temo que su pregunta falsea la práctica habitual de la econometría, en particular esta afirmación:
Por lo tanto, si estimamos la contrapartida muestral del "modelo verdadero" conseguimos una interpretación causal sobre los parámetros.
Ningún econometrista trataría de estimar $y_i = \alpha + \rho s_i + \eta_i$ en datos observacionales, bajo los supuestos dados, porque no hay forma válida de hacerlo. OLS requeriría que $E[ \eta_i s_i ] = 0$ pero $\eta_i$ y $s_i$ pueden estar correlacionados.
Edición 2 (CIA) : Este es un punto principalmente filosófico, y Angrist y Pischke pueden estar en desacuerdo con mi presentación aquí. El supuesto de independencia condicional (selección de observables) nos permite corregir el sesgo de selección. Añade un supuesto sobre las distribuciones conjuntas: que $$ f_i(s) \perp\!\!\!\perp s_i \mid X_i $$ para todos $s$ . Utilizando sólo el álgebra de expectativas condicionales (véase la derivación en Angrist y Pischke) se deduce que podemos escribir $$ y_i = f_i(s_i) = \alpha + \rho s_i + X_i' \gamma + v_i $$ con $E[v_i \mid X_i, s_i] = 0$ . Esta ecuación nos permite estimar $\rho$ en los datos utilizando OLS.
Ni la aleatoriedad ni el CIA entran en el sistema de ecuaciones que define el modelo verdadero. Son supuestos estadísticos que nos dan formas de estimar los parámetros de un modelo que ya hemos definido, utilizando los datos que tenemos. Los econometristas no suelen considerar la CIA como parte del modelo verdadero, pero Pearl la incluiría en $A$ .
2 votos
Existen múltiples escuelas de pensamiento sobre la causalidad en econometría. Véase, por ejemplo, el comentario de Heckman y Pinto (2015) sobre Pearl, o las aplicaciones del modelo de resultados potenciales de Rubin (por ejemplo, en Mostly Harmless Econometrics, de Angrist y Pischke).
0 votos
No hay modelos "verdaderos" en economía
1 votos
@Frank: gracias por el papel sugerido, seguramente serán útiles. Respecto al libro de Angrist y Pischke, lo he leído. Estudié unos diez libros de texto de econometría y Mostly Harmless Econometrics representa el mejor sobre causalidad (mi opinión, pero probablemente no la única). Aprendí mucho con él. Sin embargo, al menos en mi opinión, incluso este libro es exhaustivo. Por ejemplo, no dice nada sobre el modelo causal estructural y el vínculo entre éste y el lenguaje de resultados potenciales. Por último, no ofrece una respuesta a mis dos preguntas anteriores. O, al menos, yo no la veo.
1 votos
@Aksakal: respuesta como la tuya dice las dos cosas, todo o nada. En mi opinión no dice nada porque no me dice nada sobre: en primer lugar, por qué en muchos libros de econometría se utiliza el "modelo verdadero" (y parece muy útil, si no esencial); ¿cuáles son los vínculos entre tu respuesta y mis preguntas? Si los vínculos no existen, la presencia del "modelo verdadero" es muy difícil de explicar. En cualquier caso, sé que el "modelo verdadero" es un concepto a veces criticado y que el "mundo real" es algo diferente y los vínculos entre ellos pueden ser artificiales, pero esta es la teoría. Mi pregunta es sobre la teoría econométrica.
0 votos
@markowitz: Angrist y Pischke sí lo discuten, pero su lenguaje puede confundirte. Véase la sección 3.2.1: "la función $f_i(s)$ nos dice lo que $i$ ganaría por cualquier valor de la escolarización, $s$ . En otras palabras, $f_i(s)$ responde a las preguntas causales de "qué pasaría si"". Véase también la discusión del modelo causal de efectos constantes lineales (al final de la sección).
0 votos
@markowitz, era un comentario, no una respuesta. El tema es demasiado inestable para tener un modelo "verdadero" en el sentido en que tenemos modelos en las ciencias naturales. En cambio, los "modelos" económicos son "historias" y viñetas. Esa es la razón por la que a los economistas les encantan las "historias", y siempre hablan de ellas cuando se discuten los documentos. Esto sigue siendo sólo un comentario, no una respuesta.
0 votos
@markowitz, mi punto de vista sobre los modelos econométricos es similar a la descripción de Rubinstein sobre la microeconomía, véase la primera parte de la Introducción en sus notas de clase aquí assets.press.princeton.edu/rubinstein/front.pdf Véase también su reseña del libro arielrubinstein.tau.ac.il/papers/100.pdf Dice esto sobre los modelos: "Una historia no pretende ser "útil" en el sentido en que la mayoría de la gente utiliza la palabra... Durante mis cuarenta años en la profesión, no he encontrado un solo modelo que me convenza de que la teoría económica puede tener una utilidad práctica directa."
0 votos
@Aksakal, estás equivocado. ¿Has abierto alguna vez un libro de texto de econometría? Empieza por los clásicos como Greene "Econometric Analysis", Kennedy "A Guide to Econometrics" o Wooldridge "Introductory Econometrics" - todos ellos incluyen la noción de "modelo verdadero".
0 votos
@RichardHardy, sé que hablan de ellos "modelo verdadero", pero es delirante. Ninguno de sus modelos es verdadero en sentido convencional.
0 votos
@Aksakal, ¿quién define el sentido convencional? ¿O dónde se puede encontrar esa definición? Mi primera apuesta sería un libro de texto clásico en la materia. Supongo que no eres econometrista por formación y lo que te parece convencional puede ser específico para ti solo, o quizás para tu campo. Es lo mismo que si yo fuera a definir lo que es convencional en, por ejemplo, la química (no tengo formación de químico sino de econometrista). Incluso utilizar la palabra "delirante" en este contexto no sólo es ignorante, sino también inapropiado, en mi opinión.