2 votos

Regresión cuantil frente a MCO con variables ficticias

Quiero hacer una regresión de una variable Y sobre otra variable X (con variables de control y efectos fijos apropiados) en un entorno de datos de panel. Se me ocurren dos enfoques:

  1. Utilice la regresión cuantil;

  2. Utilice la regresión MCO para regresionar Y sobre los cuartiles de X utilizando términos de interacción, es decir, multiplicando X por una variable indicadora que toma el valor 1 si la observación pertenece a un determinado cuartil. Así que básicamente tendríamos y = intercept + D0.5*X + D0.75*X + D1.0*X + controls donde D0,5 es la variable indicadora del segundo cuartil, D0,75 es la variable indicadora del tercer cuartil, y así sucesivamente.

¿Cuál es la diferencia entre ambos enfoques y en qué casos sería más apropiado uno que otro?


Para responder a los comentarios:

  1. Intento ver cómo influye X en Y para determinados cuartiles de X. Espero que el efecto de X en Y varíe significativamente según los cuartiles de X. Ésta es básicamente la hipótesis.

  2. Las observaciones son países-años. Espero que X sólo tenga un impacto importante en Y para valores altos de X (y para otra variable, digamos X', espero que ocurra lo contrario). La idea es comprobar esta hipótesis. ¿Qué me recomienda?

  3. Tal vez ayude si soy más específico. X es un factor de entrada en un país-año (de ahí la especificación de datos de panel) y X' es otro factor de entrada. Una teoría sugiere que tanto X como X' deberían tener un impacto positivo y estadísticamente significativo en Y (variable dependiente). Otra teoría sugiere que X debería tener un impacto negativo (más negativo para valores mayores de Y) y que X' debería tener un impacto positivo y mayor a medida que Y aumenta. La idea es ver cómo afectan ambas variables a Y a lo largo de los cuantiles de Y y probar ambas teorías. Ambas teorías apoyan que la dirección de la causalidad es de X a Y y no de Y a X.

5voto

Zizzencs Puntos 1358

Ninguno de los dos métodos es apropiado porque lo que quiere hacer no lo es.

La regresión cuantil consiste en estimar los cuantiles de la variable dependiente, es decir, examina los cuantiles en lugar de la media.

El uso de variables ficticias para diferentes cuartiles de una variable independiente se denomina binning. Dado que cree que el efecto de X sobre Y será diferente en diferentes niveles de X, tiene varias opciones. Puede utilizar splines de varios tipos. Si conoce el punto exacto en el que cree que cambia el efecto de X sobre Y, puede implementar un modelo de palo de hockey; creo que es más probable que quiera estimar dónde y cómo se produce ese cambio. Entonces, los splines cúbicos restringidos podrían ser buenos.

Sin embargo, si tiene un montón de variables independientes que pueden interactuar, entonces MARS (multivariate adaptive regression splines) podría ser un buen método.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X