Me va a centrar principalmente en sus primeras tres preguntas. Las respuestas cortas son: (1) usted necesita para comparar el efecto de la IV en el DV para cada período de tiempo, pero (2) sólo la comparación de las magnitudes puede conducir a conclusiones equivocadas, y (3) hay muchas formas de hacerlo, pero no hay consenso sobre cuál es la correcta.
A continuación describo por qué simplemente no se puede comparar el coeficiente de magnitudes y punto de que algunas de las soluciones que se pensaba hasta ahora.
Según Allison (1999), a diferencia de la OPERACIÓN, coeficientes de regresión logística se ven afectados por la heterogeneidad no observada, aun cuando dicha heterogeneidad no está relacionado con la variable de interés.
Cuando el ajuste de una regresión logística como:
(1)$$
\ln\bigg(\frac{1}{1-p_i}\bigg) = \beta_{0} + \beta_{1}x_{1i}
$$
You are in fact fitting an equation predicting the value of a latent variable $y^*$ that represents the underlying propensity of each observation to assume the value $1$ in the binary dependent variable, what happens if $y^*$ is above a certain threshold. The equation for that is (Williams, 2009):
(2)$$
y^* =\alpha_{0} + \alpha_{1}x_{1} + \sigma \varepsilon
$$
The term $\varepsilon$ is assumed to be independent from the other terms and to follow a logistic distribution – or a normal distribution in the case of probit and a log-logistic distribution in case of complementary log-log and a cauchy distribution in the case of cauchit.
According to Williams (2009), the $\alpha$ coefficients in equation 2 are related to the $\beta$ coefficients in equation 1 through:
(3)$$
\beta_{j} = \frac{\alpha_{j}}{\sigma}\;\;j=1,...,J.
$$
In equations 2 and 3, $\sigma$ is the scaling factor of the unobserved variation, and we can see that the size of the estimated $\beta$ coefficients depends on $\sigma$, que no es observado. Basado en eso, Allison (1999), Williams (2009), y el estado de Ánimo (2009), entre otros, afirman que no se puede ingenuamente comparar los coeficientes entre los modelos logísticos estimada para los distintos grupos, países o períodos.
Esto es debido a que las comparaciones pueden dar a conclusiones erróneas si no se ve la variación de la diferencia entre los grupos, países o períodos. Ambas comparaciones utilizando diferentes modelos y el uso de los términos de interacción dentro del mismo modelo que sufren de este problema. Además logit, esto se aplica también a la de sus primos probit, obstrucciones de registro, cauchit y, por extensión, a tiempo discreto modelos de riesgo estimado de uso de estas funciones de enlace. Ordenó a los modelos logit también son afectados por ella.
Williams (2009) argumenta que la solución es el modelo de la no observados de la variación a través de un heterogéneo modelo de elección (un.k.un., un modelo a escala), y proporciona una Stata agregar en el llamado oglm
(Williams, 2010). En R, la heterogeneidad de modelos de elección puede estar en forma con el hetprob()
función de la glmx
paquete, que está disponible a través de RForge, pero no a través de CRAN. Ambos programas son muy fáciles de usar. Por último, Williams (2009) menciona SPSS s PLUM
rutina para el montaje de estos modelos, pero nunca lo he usado y no puedo comentar en lo fácil que es de usar.
Sin embargo, hay al menos un documento de trabajo por ahí mostrando que las comparaciones utilizando heterogéneos modelos de elección puede ser aún más sesgada si la varianza de la ecuación está mal especificada o hay un error de medición.
El estado de ánimo (2010) enumera otras soluciones que no implican la modelización de la varianza, pero el uso de las comparaciones de las predicciones de probabilidad de los cambios.
Al parecer es un problema que no está resuelto y a menudo veo ponencias en conferencias de mi campo (Sociología) viene con diferentes soluciones para ello. Yo le aconsejo que mire lo que la gente en su campo y, a continuación, decidir cómo tratar con él.
Referencias
- Allison, P. D. (1999). Comparando Logit y Probit Coeficientes Entre Grupos. Sociológico De Los Métodos Y De Investigación, 28(2), 186-208.
- El Estado De Ánimo, C. (2010). Regresión logística: ¿por Qué No Podemos Hacer Lo que Creo que se Puede Hacer, y Qué Podemos Hacer al respecto. European Sociological Review, 26(1), 67-82.
- Williams, R. (2009). Utilizando Heterogéneos Modelos de Elección para Comparar Logit y Probit Coeficientes Entre Grupos. Sociológico De Los Métodos Y De Investigación, 37(4), 531-559.
- Williams, R. (2010). Montaje heterogéneos modelos de elección con oglm. El Programa Stata Journal, 10(4), 540-567.