3 votos

Bins y efectos fijos por año

Estoy tratando de entender la diferencia entre dos modelos de regresión. Antes de ejecutar modelos más complejos (es decir, cuantiles) divido una variable independiente clave en contenedores para ver si la relación es no lineal. Lo hago de dos maneras.

Modelo (1): La variable independiente x se agrupa en 10 contenedores basados en los deciles. Luego se ejecuta una regresión con y regresionada en los 10 contenedores y efectos fijos de año.

Modelo (2): La variable independiente x se agrupa en 10 contenedores basados en los deciles dentro de cada año. Luego se ejecuta una regresión con y regresionada en los 10 contenedores y efectos fijos de año.

Si el Modelo (1) se ejecuta sin efectos fijos de año, entonces parece que los 10 contenedores pueden estar recogiendo algún tipo de tendencia temporal. Por lo tanto, el método de cálculo de contenedores en el Modelo (2) parece mejor. Mi pregunta es si incluir efectos fijos de año en el Modelo (1) elimina la correlación entre las variables de contenedor y la tendencia temporal.

En mi libro básico de pregrado (Introducción a la Econometría: Un Enfoque Moderno) dice que "para reflejar que la población puede tener una distribución diferente en diferentes períodos de tiempo, permitimos que la intersección difiera en diferentes períodos, usualmente años." Luego habla sobre cómo los dummy de año logran esto. Así que parece que la tendencia temporal está controlada. Sin embargo, la distribución de contenedores en cada año diferiría entre el Modelo (1) y el Modelo (2). Por ejemplo, en el Modelo (2) habría un número igual de observaciones en cada contenedor. Esto no sería cierto para el Modelo (1).

¿Alguna recomendación? Obtuve resultados muy diferentes al ejecutar estos dos modelos y no estoy seguro de cuál es el correcto o cómo interpretar las diferencias.

¡Gracias!

0 votos

Puede que esté leyendo esto mal, pero dices que x es la variable dependiente, pero luego dices que y se regresa en los 10 contenedores de x, lo que hace que suene como si y fuera la variable dependiente. ¿Puedes aclarar? También me gustaría saber por qué piensas que necesitas transformar una variable continua en una escala ordinal. ¿No es normal?

0 votos

Sí, perdón, x es la variable independiente. ¡No es normal!

0 votos

No deberías tirarlo, es mejor intentar un spline

0voto

Likso Puntos 68

En general, si tratas a las variables independientes como no aleatorias, no necesitas la suposición de normalidad para ellas. La normalidad es necesaria para la variable dependiente en la regresión lineal con pruebas de hipótesis (en realidad, es la normalidad de los términos de error, no de la variable en sí, pero en mi experiencia, una variable dependiente altamente no normal no suele producir un término de error normal). Esta página ofrece una descripción bastante sencilla. Sin conocer más sobre tu situación, es posible que ni siquiera necesites crear los intervalos.

Relacionado con la tendencia temporal, los efectos fijos por año se encargarán de eso por ti, correcto. Pero puede que no sean la concepción ideal del tiempo. Si tienes un número pequeño de años en tu panel, entonces los efectos fijos pueden ser los mejores. Pero si el panel es bastante largo, es posible que desees considerar tratar el tiempo como una variable continua y agregar polinomios según corresponda. Por lo general, puedes explorar eso graficando la serie temporal.

Llegando a tus dos modelos, tiene mucho sentido que te den resultados diferentes. Estás convirtiendo una variable continua en ordinal, y la ordenación de las observaciones es diferente en los dos casos. El Modelo 1 ordena a lo largo de todos los años, mientras que el Modelo 2 ordena dentro de cada año, y a menos que las observaciones estén ordenadas de la misma manera cada año, los resultados serán diferentes. No veo intuitivamente por qué querrías optar por el enfoque del Modelo 1 - si realmente deseas una relación ordinal, lo haría dentro de los paneles, no a través de ellos, ya que creo que eso te dará una interpretación más clara del coeficiente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X