15 votos

Es el Mundlak efectos fijos procedimiento aplicable para la regresión logística con dummies?

Tengo un conjunto de datos con 8000 clusters y 4 millones de observaciones. Por desgracia, mi programa estadístico Stata, se ejecuta más lentamente cuando el uso de sus datos de panel de la función de regresión logística: xtlogit, incluso con un 10% de la submuestra.

Sin embargo, cuando se utiliza el nonpanel logit los resultados de la función aparecen mucho antes. Por lo tanto yo podría ser capaz de beneficiarse con el uso de logit sobre modificación de los datos de las cuentas de efectos fijos.

Creo que este procedimiento se acuñó el "Mundlak efectos fijos procedimiento" (Mundlak, Y. 1978. La agrupación de Series de Tiempo y de la Sección Transversal de los Datos. Econometrica, 46(1), 69-85.)

He encontrado una explicación intuitiva de este procedimiento en un papel por Antonakis, J., Bendahan, S., Jacquart, P., & Lalive, R. (2010). En la fabricación de reivindicaciones causales: Una revisión y recomendaciones. El Liderazgo Trimestral, 21(6). 1086-1120. Cito:

Una manera de superar el problema de omitida efectos fijos y todavía incluir el Nivel 2 variables es incluir el clúster de medios de todos los niveles 1 covariables en el modelo estimado (Mundlak, 1978). El clúster de medios puede ser incluido como regresores o resta (es decir, en el grupo-media centrado) desde el Nivel 1 covariable. El clúster de medios son invariantes dentro de clúster (y que varían entre clusters) y permitir consistente estimación de Nivel 1 parámetros como si de efectos fijos se había incluido (ver Rabe-Hesketh Y Skrondal, 2008).

Por lo tanto clúster significa centrado parece ideal y práctico para la solución de mi problema computacional. Sin embargo, estos documentos parecen estar orientadas hacia la regresión lineal (OLS).

Es este método de clúster-significa centrado también aplicable a los "replicantes" de los efectos fijos de regresión logística binaria?

Una más técnica de la pregunta que debe producir la misma respuesta sería: es xtlogit depvar indepvars, fe con Un conjunto de datos igual a logit depvar indepvars con el conjunto de datos B cuando el conjunto de datos B es el cluster-significa centrado en la versión de Un conjunto de datos?

Una dificultad añadida a la que he encontrado en este grupo la media de centrado es cómo lidiar con los maniquíes. Porque los maniquíes son 0 o 1, son idénticos en aleatorios y de efectos fijos de regresión? En el caso de no estar "centrado"?

12voto

Andy Puntos 10250

Primera diferenciación o dentro de transformaciones como degradante no están disponibles en modelos como el logit porque en el caso de modelos no lineales tales trucos no retire el observado efectos fijos. Incluso si usted tenía un conjunto de datos más pequeño en el que fue posible incluir N-1 individual dummies para la estimación de los efectos fijos directamente, esto podría llevar a estimaciones sesgadas a menos que la dimensión temporal de los datos es grande. La eliminación de los efectos fijos en el panel logit sigue por lo tanto ninguna diferenciación ni degradante y sólo es posible debido a que el logit de forma funcional. Si usted está interesado en los detalles que usted puede echar un vistazo a estas notas por Söderbom en PDF de la página 30 (explicación de por qué degradante/primera diferenciación en el logit/probit no ayuda) y en la página 42 (introducción del panel logit estimador).

Otro problema es que xtlogit y el panel de los modelos logit, en general, no estimación de los efectos fijos directamente que son necesarios para el cálculo de los efectos marginales. Sin aquellos a los que va a ser muy incómodo para interpretar los coeficientes de lo que podría ser decepcionante después de haber corrido el modelo durante horas y horas.

Con un gran conjunto de datos y de los ya mencionados conceptual las dificultades de la FE panel logit yo me quedaría con el modelo de probabilidad lineal. Espero que esta respuesta no te defraudará, pero hay muchas buenas razones para dar este tipo de consejos: el LPM es mucho más rápido, los coeficientes pueden ser interpretados directamente (esto se aplica en particular si usted tiene efectos de interacción en el modelo, puesto que la interpretación de sus coeficientes en los modelos no lineales de los cambios!), los efectos fijos son fácilmente controlados y se puede ajustar el estándar de los errores de autocorrelación y los grupos sin estimación de los tiempos de creciente más allá de la razón. Espero que esto ayude.

1voto

Francesco Puntos 11

Creo logit condicional ("clogit" en Stata), es una alternativa fija efecto logit panel de estimador.

http://www3.nd.edu/~rwilliam/stats3/Panel03-FixedEffects.pdf

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X