Quiero hacer una regresión de una variable Y sobre otra variable X (con variables de control y efectos fijos apropiados) en un entorno de datos de panel. Se me ocurren dos enfoques:
-
Utilice la regresión cuantil;
-
Utilice la regresión MCO para regresionar Y sobre los cuartiles de X utilizando términos de interacción, es decir, multiplicando X por una variable indicadora que toma el valor 1 si la observación pertenece a un determinado cuartil. Así que básicamente tendríamos
y = intercept + D0.5*X + D0.75*X + D1.0*X + controls
donde D0,5 es la variable indicadora del segundo cuartil, D0,75 es la variable indicadora del tercer cuartil, y así sucesivamente.
¿Cuál es la diferencia entre ambos enfoques y en qué casos sería más apropiado uno que otro?
Para responder a los comentarios:
-
Intento ver cómo influye X en Y para determinados cuartiles de X. Espero que el efecto de X en Y varíe significativamente según los cuartiles de X. Ésta es básicamente la hipótesis.
-
Las observaciones son países-años. Espero que X sólo tenga un impacto importante en Y para valores altos de X (y para otra variable, digamos X', espero que ocurra lo contrario). La idea es comprobar esta hipótesis. ¿Qué me recomienda?
-
Tal vez ayude si soy más específico. X es un factor de entrada en un país-año (de ahí la especificación de datos de panel) y X' es otro factor de entrada. Una teoría sugiere que tanto X como X' deberían tener un impacto positivo y estadísticamente significativo en Y (variable dependiente). Otra teoría sugiere que X debería tener un impacto negativo (más negativo para valores mayores de Y) y que X' debería tener un impacto positivo y mayor a medida que Y aumenta. La idea es ver cómo afectan ambas variables a Y a lo largo de los cuantiles de Y y probar ambas teorías. Ambas teorías apoyan que la dirección de la causalidad es de X a Y y no de Y a X.