4 votos

Distribución del estimador de proporciones múltiples (relacionadas espacialmente)

Consideremos un proceso aleatorio espacial $Z(s)$ donde $s$ denota la ubicación espacial.

Nuestro objetivo es delimitar la zona $\mathcal{Z}$ donde la probabilidad de que $Z$ superan un umbral determinado $\zeta$ es superior a una probabilidad determinada $r$ :

$$ \mathcal{Z} = \{s | \mathrm{Pr} (Z(s) > \zeta) > r\} .$$

Conocemos una muestra $\{z_1, \dots, z_N\}$ de $N$ realizaciones de $Z(s)$ . /Solté la dependencia en $s$ en aras de la brevedad, pero el $z_i$ son funciones de la ubicación $s$ ./

Una estimación directa de la probabilidad de rebasamiento es la media de los $N$ imágenes $\{1_\zeta(z_1), \dots, 1_\zeta(z_N)\}$ mediante la función indicadora $1_\zeta : z \mapsto$ (1 si $z> \zeta$ y 0 en caso contrario).

Ahora, nos gustaría tener en cuenta la incertidumbre de esta estimación al trazar la zona estimada de probable superación $\tilde{\mathcal{Z}}$ .

La probabilidad $r$ es pequeño, digamos $5\%$ o posiblemente $1\%.$ Se espera que el tamaño de la muestra oscile entre unas pocas décadas y unos pocos cientos.

Este problema es similar a la pregunta "Intervalo de confianza para una proporción" ( Intervalo de confianza para una proporción ) salvo que consideramos varias variables dependientes, a saber, el $Z(s_1), \dots, Z(s_n)$ para un conjunto de ubicaciones $s_1, \dots, s_n$ .

Cómo mostrar (visualizar) esta incertidumbre añadida es objeto de otra pregunta ( Mostrar la incertidumbre en proporciones distribuidas espacialmente (visualización) ).

1voto

Una posible forma de hacerlo, si entiendo bien su pregunta, es tratar su proceso $Z$ como un proceso gaussiano.

Para ello, hay que dotarse de un kernel de covarianza, es decir, de una función $k$ de modo que se puede esperar que la covarianza de $Z$ a seguir: $Cov(Z(s_1), Z(s_2)) = k(s_1, s_2)$ . Un kernel de covarianza muy habitual es el función de base radial (núcleo gaussiano): $k(s_1, s_2) = exp(-\frac{(s_1-s_2)^2}{2\sigma^2})$ . Dependiendo de la forma de su proceso espacial, es posible que desee utilizar otro núcleo de covarianza, pero lo que sigue sigue siendo el mismo.

Ahora, con este núcleo y sus datos, usted es capaz de construir un predictor $\hat{Z}$ por regresión de procesos gaussianos (algunos paquetes estándar hacen el trabajo muy fácilmente). Lo interesante de esta técnica es que $\hat{Z}(s)$ es una variable gaussiana en cualquier lugar $s$ . La media es el predictor sinbiazado y también obtendrá un varianza de predicción permitiéndole construir intervalos de confianza. Esto significa que puede calcular $Pr(Z(s)>\xi)$ en cualquier $s$ y así determinar la zona que busca.

Los principales límites de este marco son los siguientes:

  • $Z$ debe ser continua. Puede intentarlo con procesos no continuos, pero obtendrá resultados extraños.
  • La mayoría de las estructuras de covarianza habituales (pero no todas) implicarán que la covarianza es estacionaria, es decir. $k(s_1, s_2) = K(s_1 - s_2)$ . Cuando el proceso se define en un espacio demasiado grande, el regresor simplemente no puede obedecer simultáneamente a todas las estructuras de covarianza locales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X