1 votos

Generación de variables aleatorias correlacionadas Bernoulli con correlaciones que decaen en el espacio

Hola,

Tengo un conjunto de N objetos distribuidos aleatoriamente en un espacio físico 2D. Cada objeto (i) genera un número aleatorio bernoulli (0 o 1) basado en una probabilidad marginal Pr(xi = 1) = p. Estos objetos están correlacionados por la distancia física. Cuanto más cerca estén los objetos, mayor será su correlación.

Por ejemplo, si los objetos i y j están ubicados conjuntamente, se espera que generen resultados correlacionados. Por ejemplo, si P(Xi=1)= 0,6 y P(Xj=1)=0,3 producirían algo así:

Xi= 0 1 0 1 1 0 1 0 1

Xj= 0 1 0 0 1 0 1 0 0

Tal que Pr(Xi|Xj)=1

Por otro lado, si i y j son distantes, producirían resultados no correlacionados, de modo que Pr(Xi|Xj)=Pr(Xi)

He intentado utilizar algunos de los paquetes de Matlab (Sampling from multivariate correlated binary and poisson random variables) y R (bindata) pero no he podido producir una matriz de correlación aceptable.

¿Alguna idea de cómo puedo producir una matriz de correlación aceptable?

Por cierto, he comprobado los siguientes mensajes anteriores proceso estocástico discreto: ¿correlación exponencial de Bernoulli?

y

Construcción de variables aleatorias Bernoulli con correlación prescrita

Pero no estoy seguro de poder relacionarme con ellos.

Gracias

1voto

Joan Carles N. Puntos 11

He aquí una sugerencia:

Definir una función decreciente no negativa $w(r)$ medir la fuerza de la interacción. Dado que cada objeto su propia e independiente $N(0,1)$ variable aleatoria $N_i$ . Ahora, establece $$ Y_i=\frac{\sum_{j}w(\|x_i-x_j\|)N_j}{\sqrt{\sum_j w(\|x_i-x_j\|)^2}}, $$ donde $x_i$ denota la ubicación del $i$ El objeto.

Entonces el $Y_i$ están correlacionados $N(0,1)$ variables aleatorias. Si dos objetos están ubicados conjuntamente, las variables aleatorias normales coinciden.

Por último, fijar $t_i=\Phi^{-1}(p_i)$ (es decir $\mathbb P(N < t_i)=p_i$ ) y establecer $X_i=1$ si $Y_i < p_i$ y 0 en caso contrario.

Con esta configuración se puede escribir la covarianza de $Y_i$ y $Y_k$ explícitamente: es sólo $$ \text{Cov}(Y_i,Y_k)=\frac{\sum_j w(\|x_i-x_j\|)w(\|x_k-x_j\|)} {\sqrt{\sum_j w(\|x_i-x_j\|)^2\sum_j w(\|x_k-x_j\|)^2}}. $$

Si se escribe esto como $\cos\theta_{ik}$ entonces se puede escribir la covarianza de $X_i$ y $X_k$ como una integral: $$ 1/(2\pi)\int_{ x < t_1\;,\; cos\theta_{ik}x+\sin\theta_{ik}y < t_2} e^{-(x^2+y^2)/2}\,dxdy-p_ip_k. $$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X