5 votos

Regresión multivariante para el conjunto de datos espaciales

Estoy tratando de decidir la técnica correcta para una regresión multivariante con datos espaciales. Me gustaría realizar una regresión en la que la variable dependiente es la profundidad de la nieve actual y las variables independientes incluyen parámetros fisiográficos (pendiente, aspecto, elevación, etc.) y la profundidad de la nieve para el mismo sitio en años anteriores utilizando datos diarios. El objetivo es producir un modelo estadístico con el que pueda interpolar la profundidad de la nieve en toda la cuenca en función de los parámetros fisiográficos.

Inicialmente iba a utilizar una MVR estándar, pero me encontré con la regresión ponderada geográficamente (GWR), que creo que es más apropiada, ya que la profundidad de la nieve está muy correlacionada espacialmente. El tercer paso, después de establecer un modelo e interpolar, sería distribuir los residuos que tendré en los puntos donde conozco la profundidad de la nieve; un enfoque común en la literatura es la ponderación de la distancia inversa de la elevación.

  1. ¿Sería incorrecto utilizar MVR en lugar de GWR?
  2. Si utilizo GWR, ¿seguiría teniendo sentido distribuir los residuos? Por lo que he leído, el GWR ya incluye alguna corrección para los inevitables residuos, a diferencia del MVR.

Por favor, corregidme si me equivoco o parece que he entendido algo mal. Soy bastante nuevo en la estadística espacial. La mayor parte de mis conocimientos sobre GWR provienen de Regresión ponderada geográficamente .

12voto

noumenal Puntos 433

Por lo que he entendido de la información enlazada, la GWR parece ser un caso especial y una extensión de la regresión por mínimos cuadrados ponderados (WLS). Con WLS el objetivo es minimizar la varianza, la mayoría de las veces para crear predicciones precisas, es decir, bs. Para la WLS ordinaria, se puede calcular un pseudoR2 (Willett & Singer, 1988). Dependiendo de la variabilidad de los parámetros fisiográficos, se puede considerar la regresión segmentada si hay puntos de ruptura claros en los datos. Dado que la GWR es algo parecido a la WLS, supongo que la GWR conduce a predicciones más precisas que la MVR. Supongo que es más fácil implementar la MVR, así que la respuesta depende de sus recursos. Si sólo hay un parámetro que deba tener en cuenta (por ejemplo, el de mayor varianza), entonces pruebe con el WLS. Pero ten cuidado al interpretar el significado de R2.

3voto

Span Puntos 163

Hace poco que he empezado a trabajar con GWR, así que tenedlo en cuenta, pero

Creo que lo importante es tener en cuenta que la GWR se utiliza más a menudo como herramienta de exploración, es decir, para ayudar a la formación de hipótesis más que para llevar a cabo pruebas de hipótesis.

La relación con el WLS es importante. La GWR emplea una matriz de ponderación en cada punto de regresión en el espacio que se está analizando, basada en una función de decaimiento de la distancia que se especifica. Con frecuencia, la función es gaussiana; también tiene que ser (en la nomenclatura GWR) calibrada, lo que puede entenderse mejor por analogía con mirar un mapa 2d a través de un agujero de alfiler. El tamaño del orificio se denomina ancho de banda y ayuda a determinar el peso de los puntos dentro y fuera del orificio.

En resumen, creo que con WLS, estás hablando de un esquema para ponderar cada observación; con GWR, estás hablando de un esquema de ponderación para cada observación con respecto a los demás observación.

Las matrices de ponderación varían a lo largo del espacio porque la GWR permite la variación espacial de los parámetros de interés. En su caso, puede estar justificado si sospecha o quiere investigar la posibilidad de que la relación entre sus variables independientes y dependientes varíe a lo largo del espacio geográfico que está estudiando.

Dado que has afirmado que la profundidad de la nieve está muy correlacionada espacialmente, parece que el GWR es un candidato prometedor. Si aún no lo ha hecho, me aseguraría de comprobar la autocorrelación con algo como la I de Moran.

Editar: @Dominik, creo que no he escrito el párrafo anterior con suficiente precisión. Si tu sospecha es que las variables independientes influyen en la profundidad de la nieve de manera diferente en cada lugar -en otras palabras, que los parámetros de regresión varían espacialmente- entonces tienes un caso que requiere GWR.

Para cubrirnos las espaldas, debo decir que el GWR no es la única herramienta de análisis multivariante espacial que se puede utilizar; sólo es la que yo conozco. En Regresión ponderada geográficamente: el análisis de las relaciones que varían en el espacio (2002), Fotheringham et al. (los principales exponentes de la GWR) identifican los siguientes métodos como pares:

  1. Método de expansión espacial de Casetti
  2. Filtrado espacialmente adaptativo
  3. Modelización multinivel
  4. Modelo de coeficientes aleatorios
  5. Otros modelos de regresión espacial, que (a diferencia de la GWR), realizan estimaciones globales de los parámetros pero sobre la base de una matriz var-covar local.

Después de haber profundizado en el GWR recientemente, creo que es una forma bastante emocionante de llegar al tipo de variación espacial del que hablas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X