9 votos

Modelado espacial tendencia de la regresión con la $(x,y)$ coordenadas como predictores

I plan de inclusión de las coordenadas como covariables en la ecuación de regresión con el fin de ajustar la distribución espacial de la tendencia que existe en los datos. Después de eso, quiero probar residuos de la autocorrelación espacial en la variación aleatoria. Tengo varias preguntas:

  1. Debo realizar la regresión lineal en el que sólo las variables independientes se $x$ $y$ coordenadas y, a continuación, las pruebas de residuos de la autocorrelación espacial, o debería, en lugar de incluir no sólo las coordenadas covariantes, pero también de otras variables y, a continuación, la prueba de los residuos.

  2. Si espero a tener tendencia cuadrática y, a continuación, incluir no sólo a $x,y$, pero también , $xy$, $x^2$ y $y^2$, pero luego algunos de ellos ( $xy$ $y^2$ ) $p$- valor mayor que el umbral-debo excluir aquellas variables con mayor $p$-valor no significativo? ¿Cómo debo interpretar la tendencia, ciertamente, no es cuadrática más?

  3. Supongo que se debe tratar a $x$ $y$ coordenadas como cualquier otras covariables, y prueba de ellos en tener una relación lineal con la variable dependiente mediante la construcción parcial de los gráficos de residuos ... pero luego, una vez que los transforman (si muestran que la necesidad de transformación), que no se que tipo de tendencia (sobre todo si me incluyen $xy$, $x^2$ y $y^2$ tendencia cuadrática). Se puede mostrar que $x^2$, por ejemplo, las necesidades de la transformación, mientras que $x$ no, o algo así? ¿Cómo debo reaccionar en estas situaciones?

Gracias.

14voto

bhagyas Puntos 101

Creo que podría ser mejor ajuste de un modelo lineal de efectos mixtos con espacialmente correlacionados con efectos aleatorios (a veces llamado un geoestadístico modelo). Suponiendo que tus datos es Gaussiano, se especifica un modelo de la forma:

$ Y_i = \mu_i + S_i + \epsilon_i, $

para $n$ observaciones $1 \leq i \leq n$, $\epsilon \sim N(0,\tau^2)$ lo que representa iid errores y $\mathbb{S} \sim MVN(\mathbb{0},\sigma^2 R)$ que representa a su territorio (donde $\mathbb{S} = \{S_1,...,S_n\}$). La media de $\mu_i$ podría ser una función de otras variables (es decir, $\mu_i = \beta_0 + \beta_1 x_{i1} + \beta_2 x_{i2}$ etc.) o podría ser simplemente ser una constante (que puede ser mejor para empezar con el último, por simplicidad).

La matriz de correlación $R$ de los términos espaciales (que determina cómo se correlaciona usted piensa que cada observación debe ser) puede ser especificado por mirar el variograma empírico. En general la correlación entre las observaciones es el elegido para que sólo dependen de la distancia entre ellos (que es donde sus coordenadas vienen en el modelo).

El capítulo 2 del Modelo basado en la geoestadística por Diggle y Ribeiro (2000) debe darle una introducción más detallada. El paquete de R geoR ha muchos de los procedimientos para el ajuste de modelos geoestadísticos, así que usted puede encontrar útil (ver http://cran.r-project.org/web/packages/geoR/geoR.pdf).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X