4 votos

El uso de Anselin Local de Moran I los Valores en la Regresión

Estoy haciendo una regresión lineal múltiple de los factores relacionados con la pobreza y nos gustaría incluir algunos espacial-datos estadísticos. He venido para arriba con Anselin Local de Moran I valores (cluster/outlier) los datos de censos en la zona metropolitana, que me gustaría incluir en la regresión.

Sin embargo, la Anselin Local de Moran I valores están indexadas con valores positivos o negativos. Un valor positivo para que me indica que una característica de vecinos cuenta con similarmente altos o bajos valores de atributo; esta característica es parte de un clúster. Un valor negativo para que me indica que una característica de vecinos cuenta con diferentes valores; esta característica es un valor atípico. Estos valores son, sin embargo, sólo se considera significativo si se indica por sus correspondientes z o p puntuaciones.

Es posible el uso de un negativo/positivo índice como este, como una variable independiente en una regresión?

Si es así, ¿cómo podría este problema a ser abordado teniendo en cuenta sólo algunas de las observaciones (Moran I los valores de las secciones censales) son considerados significativos?

Más detalles acerca de Anselin Local de Moran I se puede encontrar aquí:

http://help.arcgis.com/en/arcgisdesktop/10.0/help/index.html#//005p00000012000000

2voto

Aznfin Puntos 347

¿Por qué no utilizar un modelo de regresión espacial? Que manera de explicar la dependencia se mide por el Local de Moran I directamente en el modelo. Como un aparte, yo no aconsejaría incluyendo el local I valor en un modelo, ni un revisor, que me de confianza. No es el tema de Moran Autovector de filtrado (http://hosho.ees.hokudai.ac.jp/~kubo/Rdoc/library/spdep/html/ME.html) que funciona bien si usted no desea utilizar un totalmente espacialmente especificado modelo de regresión

2voto

Judioo Puntos 625

Parece que hay cierta confusión en torno a qué es exactamente el local de Moran I son los valores, así que vamos a repasar lo que son y, a continuación, evaluar si se les puede dar cualquier interpretación razonable en una ecuación de regresión.

En ESRI notación, creo que están hablando de poner el $z_{I_i}$ en la ecuación de regresión, o tal vez una variable ficticia para indicar si esa observación se identifica a un periférico de Alta-Alta, baja-Baja el valor de etc. La colocación de una $z_{I_i}$ valor en el lado derecho de una ecuación de regresión representa esencialmente la misma interpretación, como lo hace cualquier estandarizado de la variable (que ciertamente no carece de sentido), aunque preferiblemente debería examinar tanto los regulados y no estandarizado versiones. Valores ficticios para alto-alto, bajo-bajos valores me gustaría hestitate para el uso, aunque creo que algo de trabajo por Sergio Rey considera como la variable de resultado como el análisis de las transiciones entre los estados en un temporal del sistema (por lo que no es de la esfera de las posibilidades, pero son tan procesa la interpretación de ellos sería un reto).

Para poner una cara en este ejemplo, vamos a considerar algunos datos de ejemplo en una 4 por 4 cuadrícula. Aquí yo índice de los valores con letras en la columna y fila.

    A  B  C  D    
 A  5 17  1  6    
 B  3 10  3  7    
 C  6  1 11 12    
 D  2  0  3  4    

Ahora, ¿qué es exactamente un Local de Moran I valor? Bien, primero tenemos que definir lo que los medios locales, y la típica manera de hacer esto es para especificar una matriz de ponderaciones espaciales que se relaciona intrínsecamente cualquier valor particular a sus vecinos a través de un peso. Aquí se desarrollan cada una de las únicas espacial de observación a tener su propia fila en una matriz de datos y, a continuación, definir cada una de las observaciones en relación a cada observación en un $N$ $N$ matriz cuadrada. Aquí el primer valor se refiere a la columna y el segundo valor se refiere a la fila (para AC significa la columna a y la fila C). El desplegado valores son como a continuación y deja que se refieren a este vector columna de los valores de $x$.

    x
AA  5
AB  3
AC  6
AD  2
BA  17
BB  10
BC  1
BD  0
CA  1
CB  2
CC  11
CD  3
DA  6
DB  7
DC  12
DD  4

El siguiente ejemplo muestra sólo un tipo de matriz de ponderaciones espaciales, una fila estandarizada de la contigüidad de la matriz. Aquí defino la contigüidad de la base de cómo una Torre se mueve, por lo que sólo las células que comparten un lado de la observación original son vecinos. También me peso la asociación dividiendo 1 por el número total de vecinos (voy a ir en más detalle a decir por qué este es el tipo de matriz de pesos espaciales en el que los valores de la fila suma a la 1 tiene un buen interpretaion). Vamos a referirnos a esta matriz como $W$

    AA      AB      AC      AD      BA      BB      BC      BD      CA      CB      CC      CD      DA      DB      DC      DD
AA  0        1/2    0       0        1/2    0       0       0       0       0       0       0       0       0       0       0    
AB   1/3    0        1/3    0       0        1/3    0       0       0       0       0       0       0       0       0       0    
AC  0        1/3    0        1/3    0       0        1/3    0       0       0       0       0       0       0       0       0    
AD  0       0        1/2    0       0       0       0        1/2    0       0       0       0       0       0       0       0    
BA   1/3    0       0       0       0        1/3    0       0        1/3    0       0       0       0       0       0       0    
BB  0        1/4    0       0        1/4    0        1/4    0       0        1/4    0       0       0       0       0       0    
BC  0       0        1/4    0       0        1/4    0        1/4    0       0        1/4    0       0       0       0       0    
BD  0       0       0        1/3    0       0        1/3    0       0       0       0        1/3    0       0       0       0    
CA  0       0       0       0        1/3    0       0       0       0        1/3    0       0        1/3    0       0       0    
CB  0       0       0       0       0        1/4    0       0        1/4    0       0        1/4    0        1/4    0       0    
CC  0       0       0       0       0       0        1/4    0       0        1/4    0        1/4    0       0        1/4    0    
CD  0       0       0       0       0       0       0        1/3    0       0        1/3    0       0       0       0        1/3
DA  0       0       0       0       0       0       0       0        1/2    0       0       0       0        1/2    0       0    
DB  0       0       0       0       0       0       0       0       0        1/3    0       0        1/3    0        1/3    0    
DC  0       0       0       0       0       0       0       0       0       0        1/3    0       0        1/3    0        1/3
DD  0       0       0       0       0       0       0       0       0       0       0        1/2    0       0        1/2    0    

Para definir de local I ESRI utiliza la notación en términos de unidades individuales, pero para algunos simplicidad permite considerar algunos de álgebra de matrices. Si nos pre-multiplicar nuestro vector de columna $x$$W$, nos encontramos con una nueva columna de vectores de la misma longitud que es igual a un promedio ponderado de los vecinos de los valores. Para ver lo que está pasando en pasos más simples, permite considerar el producto escalar de nuestra $x$ vector columna y la primera fila de nuestra pesos de la matriz, lo que equivale a;

$$ \begin{bmatrix} 0 & 0.5 & 0 & 0 & 0.5 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{bmatrix} \cdot \begin{bmatrix} 5 \\ 3 \\ 6 \\ 2 \\ 17 \\ 10 \\ 1 \\ 0 \\ 1 \\ 2 \\ 11 \\ 3 \\ 6 \\ 7 \\ 12 \\ 4 \\ \end{bmatrix} = 10$$

If you go through the individual operations on this you will see that this dot product with the row-standardized weights matrix amounts to the average of the neighboring values for each individual observation. The operation of multiplying $W \cdot x$ just amounts to estimating the dot product of every spatial weight row and the column vector $x$ combination just like this.

How this relates to the Local I values, and why your $I_i$ valores a veces negativo, es que normalmente considere Local I valores como la descomposición de la global de Moran I de la prueba, en cuyo caso no evaluamos el real situado promedio ponderado, pero como desviaciones de la media. Luego nos estandarizar este valor mediante la división de las desviaciones Locales por la desviación estándar de la media, lo que en esencia le da Z-scores. Es cierto que puntajes estandarizados no siempre sencillo de interpretar en el análisis de regresión (que algunas veces son útiles para comparar con otros coeficientes en intrínsecamente diferentes escalas), pero que la crítica no se aplica simplemente el promedio ponderado de los vecinos.

Considere el caso donde los valores de x de arriba son quadrat células (sólo una hoja cuadriculada) más de Raccoon city, y la cuenta son el número estimado de los delincuentes conocidos que viven en esas particular quadrats. De la teoría criminológica sin duda, es razonable esperar que el número de delitos en un cuadrado no es sólo una función del número de delincuentes en el local quadrat, pero el número de delincuentes en las cercanías de quadrats así. En esa situación de tener tanto efectos en la ecuación es lógico y proporciona una interpretación útil.

Ahora, cosas a tener en cuenta en adición a esto el hecho de que es más general que los modelos espaciales, como Corey sugiere, probablemente será necesario. Es a menudo el caso en tales modelos espaciales que aún existe espacial de auto-correlación en los residuos. Corey referencia sugerida es imprescindible un modelo de error espacial, que no es fácil generalizar la incorporación de efectos espaciales de las variables independientes. Un espacio-Durbin modelo, aunque. Yo le recomiendo leer los primeros 3 capítulos de Lesage y el Ritmo de la Introducción a la Econometría Espacial.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X