Si
no todos las muestras son del mismo lugar
equivale a
casi todos las muestras son del mismo lugar
o dicho de otra manera que $2000$ y $2010$ soportes espaciales se cruzan ampliamente (como en $\rm{Fig.1}$ ), se puede aplicar el siguiente enfoque.
![enter image description here]()
Qué "En general" significa ? El hecho de centrarse sólo en la intersección cambia o no la cuestión de la investigación. Por ejemplo, si la intersección se limita a una zona urbana demasiado pequeña, por ejemplo, y que en un principio se interesaba por la zona metropolitana en general, su pregunta de investigación cambiaría y lo que sigue no le convendría.
Centrándose sólo en la intersección de los dos años de apoyo espacial
Puedes construir un $2D$ continuo interpolado por kriging sobre el que se puede proyectar una retícula cuyo perímetro está formado por el sobre convexo del conjunto de puntos pertenecientes a la intersección descrita anteriormente (y mostrada en $\rm{Fig.1}$ ). Los nodos de la retícula así proyectada se van a utilizar como "individuos" dentro del bootstrapping proceso. Así (ver $\rm{Fig.2}$ ), cada nodo tendrá año- $2000$ y el año $2010$ concentraciones adjuntas.
![enter image description here]()
Los pasos son:
- Obtenga para cada remuestreo de boostrap $b=1, ..., k$ y para todos sus individuos (nodos) $i=1, ..., n$ (posiciones duplicadas $\iff$ no todas las posiciones de la muestra original, ya que el tamaño de la remuestra sigue siendo $n$ ): $C_{b,i,2000}$ , $C_{b,i,2010}$ y $C_{b,i,2000} \times C_{b,i,2010}$
-
Calcular las tres medias muestrales de cada remuestreo $b=1, ..., k$ como sigue
$\forall b, \overline{C_{b,2000}} = \frac{1}{n}\sum_{i=1}^n C_{b,i,2000}$
$\forall b, \overline{C_{b,2010}} = \frac{1}{n}\sum_{i=1}^n C_{b,i,2010}$
$\forall b, \overline{C_{b,2000} \times C_{b,2010}}= \frac{1}{n}\sum_{i=1}^n C_{b,i,2000} \times C_{b,i,2010}$
Una vez que se le proporcionen estas tres distribuciones empíricas bootstrap de las medias muestrales, puede querer calcular las correspondientes tres medias empíricas bootstrap
-
Calcula $\hat{E}(C_{2000})$ , $\hat{E}(C_{2010})$ y $\hat{E}(C_{2000} \times C_{2010})$ de la siguiente manera:
$\hat{E}(C_{2000}) = \frac{1}{k} \sum_{b=1}^k \overline{C_{b,2000}}$
$\hat{E}(C_{2010}) = \frac{1}{k} \sum_{b=1}^k \overline{C_{b,2010}}$
$\hat{E}(C_{2000} \times C_{2010}) = \frac{1}{k} \sum_{b=1}^k \overline{C_{b,2000} \times C_{b,2010}}$
Y finalmente (también reutilizando tu notación para la covarianza)
- Calcula $V(C)_{2000,2010} = cov(C_{2000},C_{2010}) = \hat{E}(C_{2000} \times C_{2010}) - \hat{E}(C_{2000})\hat{E}(C_{2010})$
Y no te olvides de poner $k$ lo más cerca posible de $\frac{(2n-1)!}{n!(n-1)!}$ (lo cual es muy probable que sea costoso desde el punto de vista computacional).
Naturalmente, podría haberme saltado el paso 2, calculando directamente las tres medias empíricas del bootstrap, por ejemplo $\hat{E}(C_{2000}) = \frac{1}{kn} \sum_{b=1}^k \sum_{i=1}^nC_{b,i,2000}$
Los puntos críticos de este enfoque son (i) cómo es posible que el practicante se desplace por sus nodos de la red y (ii) cómo puede acceder a los datos relacionados con cada nodo de la red y procesarlos (calculando y almacenando los resultados)
Mis fuentes son teóricas: utilizando las dos definiciones de bootstrapping y covarianza.