2 votos

Determinación de la covarianza de los datos espaciales espaciados irregularmente

Estoy comparando la concentración CC de un contaminante en la misma región espacial en dos puntos temporales de 2000 y 2010 con un tamaño de muestra de N2000N2000 = 51 y N2010N2010 = 26 (no todas las muestras son del mismo lugar), media de μ(C)2000μ(C)2000 = 47 y μ(C)2010μ(C)2010 = 27 (determinado por el kriging en bloque de todas las observaciones puntuales) y la varianza de V(C)2000V(C)2000 = 89 y V(C)2010V(C)2010 = 68 (varianza de kriging). Para determinar si ha habido algún cambio significativo en los últimos 10 años, primero tenemos que determinar la varianza del cambio en la zona:

V(ΔC)=V(C)2000+V(C)2010V(C)2000,2010V(ΔC)=V(C)2000+V(C)2010V(C)2000,2010

donde, V(ΔC)V(ΔC) es la varianza del cambio en el tiempo; y V(C)2000,2010V(C)2000,2010 es la covarianza entre las dos muestras temporales. ¿Alguien sabe cómo determinar la V(C)2000,2010V(C)2000,2010 en la ecuación anterior?

1voto

tanon Puntos 48

Si

no todos las muestras son del mismo lugar

equivale a

casi todos las muestras son del mismo lugar

o dicho de otra manera que 20002000 y 20102010 soportes espaciales se cruzan ampliamente (como en Fig.1Fig.1 ), se puede aplicar el siguiente enfoque.

enter image description here

Qué "En general" significa ? El hecho de centrarse sólo en la intersección cambia o no la cuestión de la investigación. Por ejemplo, si la intersección se limita a una zona urbana demasiado pequeña, por ejemplo, y que en un principio se interesaba por la zona metropolitana en general, su pregunta de investigación cambiaría y lo que sigue no le convendría.


Centrándose sólo en la intersección de los dos años de apoyo espacial

Puedes construir un 2D2D continuo interpolado por kriging sobre el que se puede proyectar una retícula cuyo perímetro está formado por el sobre convexo del conjunto de puntos pertenecientes a la intersección descrita anteriormente (y mostrada en Fig.1Fig.1 ). Los nodos de la retícula así proyectada se van a utilizar como "individuos" dentro del bootstrapping proceso. Así (ver Fig.2Fig.2 ), cada nodo tendrá año- 20002000 y el año 20102010 concentraciones adjuntas.

enter image description here

Los pasos son:

  1. Obtenga para cada remuestreo de boostrap b=1,...,kb=1,...,k y para todos sus individuos (nodos) i=1,...,ni=1,...,n (posiciones duplicadas no todas las posiciones de la muestra original, ya que el tamaño de la remuestra sigue siendo nn ): Cb,i,2000Cb,i,2000 , Cb,i,2010Cb,i,2010 y Cb,i,2000×Cb,i,2010Cb,i,2000×Cb,i,2010
  2. Calcular las tres medias muestrales de cada remuestreo b=1,...,kb=1,...,k como sigue

    b,¯Cb,2000=1nni=1Cb,i,2000b,¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Cb,2000=1nni=1Cb,i,2000

    b,¯Cb,2010=1nni=1Cb,i,2010b,¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Cb,2010=1nni=1Cb,i,2010

    b,¯Cb,2000×Cb,2010=1nni=1Cb,i,2000×Cb,i,2010b,¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Cb,2000×Cb,2010=1nni=1Cb,i,2000×Cb,i,2010

Una vez que se le proporcionen estas tres distribuciones empíricas bootstrap de las medias muestrales, puede querer calcular las correspondientes tres medias empíricas bootstrap

  1. Calcula ˆE(C2000)^E(C2000) , ˆE(C2010)^E(C2010) y ˆE(C2000×C2010)^E(C2000×C2010) de la siguiente manera:

    ˆE(C2000)=1kkb=1¯Cb,2000^E(C2000)=1kkb=1¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Cb,2000

    ˆE(C2010)=1kkb=1¯Cb,2010^E(C2010)=1kkb=1¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Cb,2010

    ˆE(C2000×C2010)=1kkb=1¯Cb,2000×Cb,2010^E(C2000×C2010)=1kkb=1¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯Cb,2000×Cb,2010

Y finalmente (también reutilizando tu notación para la covarianza)

  1. Calcula V(C)2000,2010=cov(C2000,C2010)=ˆE(C2000×C2010)ˆE(C2000)ˆE(C2010)V(C)2000,2010=cov(C2000,C2010)=^E(C2000×C2010)^E(C2000)^E(C2010)

Y no te olvides de poner kk lo más cerca posible de (2n1)!n!(n1)!(2n1)!n!(n1)! (lo cual es muy probable que sea costoso desde el punto de vista computacional).


Naturalmente, podría haberme saltado el paso 2, calculando directamente las tres medias empíricas del bootstrap, por ejemplo ˆE(C2000)=1knkb=1ni=1Cb,i,2000^E(C2000)=1knkb=1ni=1Cb,i,2000

Los puntos críticos de este enfoque son (i) cómo es posible que el practicante se desplace por sus nodos de la red y (ii) cómo puede acceder a los datos relacionados con cada nodo de la red y procesarlos (calculando y almacenando los resultados)

Mis fuentes son teóricas: utilizando las dos definiciones de bootstrapping y covarianza.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X