2 votos

Determinación de la covarianza de los datos espaciales espaciados irregularmente

Estoy comparando la concentración $C$ de un contaminante en la misma región espacial en dos puntos temporales de 2000 y 2010 con un tamaño de muestra de $N_{2000}$ = 51 y $N_{2010}$ = 26 (no todas las muestras son del mismo lugar), media de $\mu(C)_{2000}$ = 47 y $\mu(C)_{2010}$ = 27 (determinado por el kriging en bloque de todas las observaciones puntuales) y la varianza de $V(C)_{2000}$ = 89 y $V(C)_{2010}$ = 68 (varianza de kriging). Para determinar si ha habido algún cambio significativo en los últimos 10 años, primero tenemos que determinar la varianza del cambio en la zona:

$V(\Delta C) = V(C)_{2000} + V(C)_{2010} - V(C)_{2000,2010}$

donde, $V(\Delta C)$ es la varianza del cambio en el tiempo; y $V(C)_{2000,2010}$ es la covarianza entre las dos muestras temporales. ¿Alguien sabe cómo determinar la $V(C)_{2000,2010}$ en la ecuación anterior?

1voto

tanon Puntos 48

Si

no todos las muestras son del mismo lugar

equivale a

casi todos las muestras son del mismo lugar

o dicho de otra manera que $2000$ y $2010$ soportes espaciales se cruzan ampliamente (como en $\rm{Fig.1}$ ), se puede aplicar el siguiente enfoque.

enter image description here

Qué "En general" significa ? El hecho de centrarse sólo en la intersección cambia o no la cuestión de la investigación. Por ejemplo, si la intersección se limita a una zona urbana demasiado pequeña, por ejemplo, y que en un principio se interesaba por la zona metropolitana en general, su pregunta de investigación cambiaría y lo que sigue no le convendría.


Centrándose sólo en la intersección de los dos años de apoyo espacial

Puedes construir un $2D$ continuo interpolado por kriging sobre el que se puede proyectar una retícula cuyo perímetro está formado por el sobre convexo del conjunto de puntos pertenecientes a la intersección descrita anteriormente (y mostrada en $\rm{Fig.1}$ ). Los nodos de la retícula así proyectada se van a utilizar como "individuos" dentro del bootstrapping proceso. Así (ver $\rm{Fig.2}$ ), cada nodo tendrá año- $2000$ y el año $2010$ concentraciones adjuntas.

enter image description here

Los pasos son:

  1. Obtenga para cada remuestreo de boostrap $b=1, ..., k$ y para todos sus individuos (nodos) $i=1, ..., n$ (posiciones duplicadas $\iff$ no todas las posiciones de la muestra original, ya que el tamaño de la remuestra sigue siendo $n$ ): $C_{b,i,2000}$ , $C_{b,i,2010}$ y $C_{b,i,2000} \times C_{b,i,2010}$
  2. Calcular las tres medias muestrales de cada remuestreo $b=1, ..., k$ como sigue

    $\forall b, \overline{C_{b,2000}} = \frac{1}{n}\sum_{i=1}^n C_{b,i,2000}$

    $\forall b, \overline{C_{b,2010}} = \frac{1}{n}\sum_{i=1}^n C_{b,i,2010}$

    $\forall b, \overline{C_{b,2000} \times C_{b,2010}}= \frac{1}{n}\sum_{i=1}^n C_{b,i,2000} \times C_{b,i,2010}$

Una vez que se le proporcionen estas tres distribuciones empíricas bootstrap de las medias muestrales, puede querer calcular las correspondientes tres medias empíricas bootstrap

  1. Calcula $\hat{E}(C_{2000})$ , $\hat{E}(C_{2010})$ y $\hat{E}(C_{2000} \times C_{2010})$ de la siguiente manera:

    $\hat{E}(C_{2000}) = \frac{1}{k} \sum_{b=1}^k \overline{C_{b,2000}}$

    $\hat{E}(C_{2010}) = \frac{1}{k} \sum_{b=1}^k \overline{C_{b,2010}}$

    $\hat{E}(C_{2000} \times C_{2010}) = \frac{1}{k} \sum_{b=1}^k \overline{C_{b,2000} \times C_{b,2010}}$

Y finalmente (también reutilizando tu notación para la covarianza)

  1. Calcula $V(C)_{2000,2010} = cov(C_{2000},C_{2010}) = \hat{E}(C_{2000} \times C_{2010}) - \hat{E}(C_{2000})\hat{E}(C_{2010})$

Y no te olvides de poner $k$ lo más cerca posible de $\frac{(2n-1)!}{n!(n-1)!}$ (lo cual es muy probable que sea costoso desde el punto de vista computacional).


Naturalmente, podría haberme saltado el paso 2, calculando directamente las tres medias empíricas del bootstrap, por ejemplo $\hat{E}(C_{2000}) = \frac{1}{kn} \sum_{b=1}^k \sum_{i=1}^nC_{b,i,2000}$

Los puntos críticos de este enfoque son (i) cómo es posible que el practicante se desplace por sus nodos de la red y (ii) cómo puede acceder a los datos relacionados con cada nodo de la red y procesarlos (calculando y almacenando los resultados)

Mis fuentes son teóricas: utilizando las dos definiciones de bootstrapping y covarianza.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X