El modelo de Poisson (y posteriormente el binomial negativo) no puede tener un desfase espacial endógeno, ya que implica que la distribución es no estacionaria (cuando el término autorregresivo es positivo). Consideremos un ejemplo más sencillo con datos de series temporales. Con un modelo lineal, digamos que estimamos la ecuación (con un término autorregresivo):
$$y_t = 0.5 \cdot y_{t-1} + e$$
Ahora digamos que la serie en $t_0 = 0$ y en el momento $t_1$ se produce un choque en el sistema de $4$ ¿Qué ocurre con este choque a lo largo del tiempo?
$$\begin{array} \\ y_1 = 4 \\ y_2 = 0.5 \cdot 4 = 2 \\ y_3 = 0.5 \cdot 2 = 1 \\ y_4 = 0.5 \cdot 1 = 0.5 \\ \vdots \end{array}$$
El efecto global de ese choque acaba descomponiéndose en $0$ . ¿Qué ocurre con un modelo de Poisson (y posteriormente con el binomio negativo) y la función exponencial?
$$y_t = \exp(0.1 \cdot y_{t-1})$$
\begin{array} \\ y_1 = 4 \\ y_2 = \exp(0.1 \cdot 4) \approx 1.5 \\ y_3 = \exp(0.1 \cdot 1.5) \approx 1.2 \\ y_4 = \exp(0.1 \cdot 1.2) \approx 1.1 \\ \vdots \end{array}
En el límite esto simplemente pasa a $1.1$ y así este shock nunca desaparece. Si rellenamos los números con un término autorregresivo de $0.5$ en su lugar tendrá un término explosivo. Que el término sea explosivo o no depende del tamaño del choque, siendo la relación $\exp(a \cdot x) < x$ . Así que cualquier choque que no satisfaga la relación $a < \log(x)/x$ será explosivo, y cualquier término autorregresivo sobre $\log(3)/3 \approx 0.37$ será explosivo para cualquier tamaño de choque del sistema para enteros positivos. El mismo problema se plantea en los modelos con desfases espaciales en lugar de temporales.
¿Cómo se ha abordado esta cuestión en los modelos espaciales de recuento? Normalmente, la gente se centra en modelizar la autocorrelación en los errores del sistema, en contraposición a un desfase espacial endógeno (para un contraejemplo, véase Lambert et al. (2010) - en el que el término AR es el registro del desfase espacial más una pequeña constante). Sin embargo, la modelización del error puede hacerse de varias maneras, incluyendo los términos en función de la ubicación espacial o de otras formas (por ejemplo, términos de vectores propios basados en los residuos ponderados), véase Dormann et al., (2007) para una revisión. Para otro enfoque único, véase Bhati (2008) (que publicó macros SAS para estimar dichos modelos).
Un enfoque popular en epidemiología es estimar modelos autorregresivos condicionales, que son conceptualmente un poco diferentes pero populares en un enfoque bayesiano (es más como utilizar el desfase espacial como un offset). Skrondal y Rabe-Hesketh (2004) tener un ejemplo en Stata.
Aunque el uso de modelos binomiales negativos para los datos de recuento de delitos es básicamente una norma de facto en los trabajos académicos, personalmente, mi experiencia con los datos de recuento de delitos me hace pensar que modelizar los recuentos utilizando OLS no es tan malo (la función exponencial tiene sus propios problemas ).
0 votos
Nota para los lectores: A pesar de la mención de Stata en el título, ésta parece ser una cuestión principalmente estadística.
0 votos
N.B. NB = binomio negativo aquí, no nota bene.
0 votos
Véase también la misma pregunta que hizo el OP en el Sitio SIG . (Por lo general, la publicación cruzada se desaconseja - bienvenido al sitio).
0 votos
A partir del 24/07/2019, el sitio SIG señalado por Andy W, ha sido eliminado, por lo que no está disponible.