19 votos

Alternativas sólidas a la I de Moran

Moran's I una medida de autocorrelación espacial, no es un estadístico especialmente robusto (puede ser sensible a distribuciones sesgadas de los atributos de los datos espaciales).

¿Cuáles son algunos robusto técnicas para medir la autocorrelación espacial? Estoy particularmente interesado en soluciones que estén fácilmente disponibles/implementables en un lenguaje de scripting como R. Si las soluciones se aplican a circunstancias únicas/distribuciones de datos, por favor especifíquelas en su respuesta.


EDITAR : Amplío la pregunta con algunos ejemplos (en respuesta a los comentarios/respuestas a la pregunta original)

Se ha sugerido que las técnicas de permutación (en las que se genera una distribución de muestreo I de Moran mediante un procedimiento de Montecarlo) ofrecen una solución sólida. A mi entender, este tipo de prueba elimina la necesidad de hacer suposiciones sobre la distribución I de Moran (dado que la estadística de la prueba puede verse influida por la estructura espacial del conjunto de datos), pero no veo cómo la técnica de permutación corrige la datos de atributos con distribución no normal . Ofrezco dos ejemplos: uno que demuestra la influencia de los datos sesgados en el estadístico I de Moran local, el otro en el I de Moran global, incluso con pruebas de permutación.

Usaré Zhang et al. 's (2008) como primer ejemplo. En su trabajo, muestran la influencia de la distribución de los datos de atributos en la local Moran's I utilizando pruebas de permutación (9999 simulaciones). He reproducido los resultados de los puntos calientes de los autores para las concentraciones de plomo (Pb) (con un nivel de confianza del 5%) utilizando los datos originales (panel izquierdo) y una transformación logarítmica de esos mismos datos (panel derecho) en GeoDa. También se presentan gráficos de caja de las concentraciones de Pb originales y transformadas logarítmicamente. Aquí, el número de puntos calientes significativos casi dobles cuando se transforman los datos; este ejemplo muestra que la estadística local es sensibles a la distribución de los datos de atributos, ¡incluso cuando se utilizan técnicas de Montecarlo!

enter image description here

El segundo ejemplo (datos simulados) demuestra la influencia que pueden tener los datos sesgados en la global Moran's I incluso cuando se utilizan pruebas de permutación. Un ejemplo, en R , sigue:

library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n  <- length(NB)
set.seed(4956)
x.norm <- rnorm(n) 
rho    <- 0.3          # autoregressive parameter
W      <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value

Obsérvese la diferencia en los valores P. Los datos sesgados indican que no hay agrupación a un nivel de significación del 5% (p=0,167), mientras que los datos distribuidos normalmente indican que sí la hay (p=0,013).


Chaosheng Zhang, Lin Luo, Weilin Xu, Valerie Ledwith, Use of local Moran's I and GIS to identify pollution hotspots of Pb in urban soils of Galway, Ireland, Science of The Total Environment, Volume 398, Issues 1-3, 15 July 2008, Pages 212-221

2voto

Adam Tuttle Puntos 7982

(Esto es demasiado complicado como para convertirlo en un comentario)

Esto se refiere a local y global (no una medida específica e independiente de la muestra de la autocorrelación). Puedo apreciar que la I de Moran específica medir es una estimación sesgada de la correlación (interpretándolo en los mismos términos que el coeficiente de correlación de Pearson), sigo sin ver cómo la prueba de hipótesis de permutación es sensible a la distribución original de la variable (ya sea en términos de errores de tipo 1 o de tipo 2).

Adaptando ligeramente el código que proporcionaste en el comentario (los pesos espaciales colqueen faltaba);

library(spdep)
data(columbus)
attach(columbus)

colqueen <- nb2listw(col.gal.nb, style="W") #weights object was missing in original comment
MC1 <- moran.mc(PLUMB,colqueen,999)
MC2 <- moran.mc(log(PLUMB),colqueen,999)
par(mfrow = c(2,2))
hist(PLUMB, main = "Histogram PLUMB")
hist(log(PLUMB), main = "HISTOGRAM log(PLUMB)")
plot(MC1, main = "999 perm. PLUMB")
plot(MC2, main = "999 perm. log(PLUMB)")

Cuando se realizan pruebas de permutación (en este caso, me gusta pensar que es como mezclar el espacio), el prueba de hipótesis de la autocorrelación espacial global no debería verse afectada por la distribución de la variable, ya que la distribución simulada de la prueba cambiará en esencia con la distribución de las variables originales. Probablemente se podrían hacer simulaciones más interesantes para demostrar esto, pero como se puede ver en este ejemplo, la estadística de prueba observada es bien fuera de la distribución generada tanto para el PLUMB y el registrado PLUMB (que se aproxima mucho más a una distribución normal). Aunque se puede ver que la distribución de la prueba PLUMB registrada bajo el nulo se desplaza más cerca de la simetría alrededor de 0.

enter image description here

De todas formas iba a sugerir esto como alternativa, transformando la distribución para que sea aproximadamente normal. También iba a sugerir la búsqueda de recursos en el filtrado espacial (y de manera similar el Getis-Ord estadísticas locales y globales), aunque no estoy seguro de que esto ayudará con una medida libre de escala, ya sea (pero tal vez puede ser fructífera para las pruebas de hipótesis). Volveré más tarde con más bibliografía de interés.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X