12 votos

La estimación de los parámetros de un proceso espacial

Me dan un $n\times n$ cuadrícula de valores enteros positivos. Estos números representan una intensidad que debe corresponder a la fuerza de la creencia de una persona que ocupa de que la ubicación de la red (un valor más alto indica una mayor creencia). Una persona, en general, tienen una influencia sobre varias celdas de cuadrícula.

Yo creo que el patrón de intensidades que debe "mirar Gaussiano" en la que habrá una ubicación central de alta intensidad y, a continuación, la intensidad disminuye radialmente en todas las direcciones. Específicamente, me gustaría modelo de los valores como proveniente de una "escala de Gauss" con un parámetro para la varianza y la otra para el factor de escala.

Hay dos factores que complican:

  • la ausencia de una persona que no corresponden a un valor cero, debido a que el ruido de fondo y otros efectos, pero los valores deben ser menores. Pueden ser errático, y en una primera aproximación, podría ser difícil de modelo como simple ruido Gaussiano.
  • El rango de intensidad puede variar. Por ejemplo, los valores pueden oscilar entre 1 y 10, y en otro, entre el 1 y el 100.

Estoy buscando una adecuada estimación de los parámetros de la estrategia, o punteros de la literatura relevante. Punteros a qué me estoy acercando este problema de la manera equivocada por completo también sería apreciado :). He estado leyendo acerca de kriging, y Gaussiano procesos, pero que parece muy maquinaria pesada para mi problema.

5voto

David Cumps Puntos 370

Usted puede utilizar este módulo de la pysal biblioteca de python para el análisis de datos espacial métodos de discutir a continuación.

Su descripción de cómo cada uno la actitud de la persona es influenciada por las actitudes de la gente alrededor de ella puede ser representado por un modelo autorregresivo espacial (SAR) (también ver a mi simple SAR explicación de esta respuesta SE 2). El enfoque más sencillo es hacer caso omiso de otros factores, y la estimación de la fuerza de la influencia de cómo las personas que rodean afectan el uno al otro las actitudes mediante la Moran I estadística.

Si desea evaluar la importancia de otros factores, mientras que la estimación de la fuerza de la influencia de la gente que los rodea, una tarea más compleja, entonces se puede estimar los parámetros de una regresión: $y = bx + rhoWy + e$. Consulte la documentación aquí.(Métodos de estimación de este tipo de regresión venir desde el campo de la econometría espacial y puede conseguir mucho más sofisticado que el de referencia que me dio.)

Su reto será construir una matriz de ponderaciones espaciales ($W$). Creo que cada elemento de a $w_{ij}$ de la matriz debe ser 1 o 0 en función de si la persona $i$ está dentro de distancia que usted siente que es necesario para influir en la otra persona $j$.

Para tener una idea intuitiva del problema, a continuación se ilustran cómo espacial autorregresivo generadora de datos de proceso (DGP) hará un patrón de valores. Para el 2 de celosías de valores simulados de los bloques blancos que representan valores altos y los bloques oscuros representan valores bajos.

En la primera celosía por debajo de los valores de cuadrícula han sido generados por un aleatorias distribuidas normalmente el proceso (o de Gauss), donde $rho$ es cero.

Random (Gaussian)

En el siguiente entramado por debajo de los valores de cuadrícula han sido generados por un espacial autorregresivo proceso, donde $rho$ ha sido algo alto, dicen .8. enter image description here

3voto

Marc-Andre R. Puntos 789

Aquí es una simple idea que podría funcionar. Como he dicho en los comentarios si usted tiene una cuadrícula con intensidades ¿por qué no ajuste de la densidad de distribución bivariante?

Aquí está el gráfico de ejemplo para ilustrar mi punto: enter image description here

Cada punto de la rejilla con se muestra como un cuadrado, de color de acuerdo a la intensidad. Superpuestas en el gráfico es el gráfico de contorno de densidad normal bivariada de la parcela. Como se puede ver las líneas de contorno se expanda en la dirección de la disminución de la intensidad. El centro será controlado por la media de bivariante normal y la propagación de la intensidad de acuerdo a la matriz de covarianza.

Para obtener las estimaciones de la media y la matriz de covarianza simple numéricos de optimización puede ser utilizado, comparar las intensidades de los valores de la función de densidad utilizando la media y la matriz de covarianza como parámetros. Minimizar para obtener las estimaciones.

Este es, por supuesto, estrictamente hablando, no de una estimación estadística, pero al menos te dará una idea de cómo proceder.

Aquí está el código para reproducir el gráfico:

require(mvtnorm)
sigma=cbind(c(0.1,0.7*0.1),c(0.7*0.1,0.1))

x<-seq(0,1,by=0.01)
y<-seq(0,1,by=0.01)
z<-outer(x,y,function(x,y)dmvnorm(cbind(x,y),mean=mean,sigma=sigma))

mz<-melt(z)

mz$X1<-(mz$X1-1)/100
mz$X2<-(mz$X2-1)/100

colnames(mz)<-c("x","y","z")

mz$intensity<-round(mz$z*1000)

ggplot(mz, aes(x,y)) + geom_tile(aes(fill = intensity), colour = "white") + scale_fill_gradient(low = "white",     high = "steelblue")+geom_contour(aes(z=z),colour="black")

2voto

Eran Medan Puntos 193

Su modelo es bidimensional del campo aleatorio de $X[i,j]$, y usted está tratando de estimar la distribución conjunta de la entero-los valores de las variables aleatorias $X[i,j]$. Usted va a querer asumir espacial estacionariedad: es decir, la distribución conjunta de $(X[i_1,j_1],...,X[i_m,j_m])$ es la misma que la distribución conjunta de $(X[i_1+k,j_1+l]...,X[i_m+k,j_m+l])$. En particular, la distribución marginal es el mismo para cada una de las células. Una simple pregunta a plantear es la autocorrelación de la estructura del campo. Es decir, ¿qué es $corr(X[i_1,j_1],X[i_2,j_2])$, dada la distancia $d([i_1,j_1],[i_2,j_2])$? Representamos esta función $\rho(d)$. Un modelo simple para la estructura de autocorrelación es $\rho(d)=kd^{-1}$ donde $k$ es una constante.

Un 'gaussian' efecto corresponde a una ecuación cuadrática función de distancia, pero hay muchas otras las funciones de la distancia que usted debe considerar, tales como el rol de la norma $d([i_1,j_1],[i_2,j_2]) = |i_1-i_2|+|j_1-j_2|$. Una vez que usted haya decidido sobre una función de distancia y la forma de su modelo de autocorrelación es lo suficientemente simple para estimar el $\rho(d)$ por ejemplo, a través de máxima verosimilitud. Para más ideas, buscar el "campo aleatorio".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X