4 votos

¿Cuál es la probabilidad de que dos vectores aleatorios independientes con una distancia euclídea dada $r$ caen en el mismo ortante?

Consideremos dos vectores aleatorios independientes e idénticamente distribuidos de dimensionalidad $N$ , $\mathbf{x}$ y $\mathbf{y}$ donde sus elementos son iid generados a partir de una gaussiana con media cero y varianza igual a $\sigma^2$ es decir, $\mathbf{x} , \mathbf{y} \sim \mathcal{N}(0, \sigma^2)$ .

¿Cuál es la probabilidad de que $\mathrm{sign}(\mathbf{x})=(\mathrm{sign(x_1)},\mathrm{sign(x_2)}, \ldots, \mathrm{sign(x_N)})$ sea igual a $\mathrm{sign}(\mathbf{y})=(\mathrm{sign(y_1)},\mathrm{sign(y_2)}, \ldots, \mathrm{sign(y_N)})$ si su distancia euclidiana es inferior a $r$ , $r \geq 0$ : $\Pr\left[ \mathrm{sign}(\mathbf{x})=\mathrm{sign}(\mathbf{y})\ \vert\ \Vert \mathbf{x} - \mathbf{y} \Vert \leq r\right]$ .

Nota: $\mathbf{x}$ y $\mathbf{y}$ son independientes.

3voto

Xenph Yan Puntos 20883

Esta no es una respuesta completa, pero puede proporcionarle un camino a seguir. Como enfoque práctico, le sugiero que realice una simulación para hacerse una idea del aspecto de la propiedad resultante y, a continuación, empiece a deducir una fórmula.

He aquí una simulación de este tipo para una desviación típica fija. Si jugamos con otras desviaciones típicas obtendremos resultados similares.

require(lattice)

stdev <- 1
N <- 5
trials <- 2000

resPerN <- data.frame("N"=rep(1:N,each=trials),
              "r"=rep(-1,N*trials),
              "prob"=rep(-1,N*trials))

for(n in 1:N){
    res <- data.frame("r"=rep(-1,trials),"signum"=rep(-1,trials))

    for(i in 1:trials){
      x <- rnorm(n,0,stdev)
      y <- rnorm(n,0,stdev)
      diff <- sqrt(sum((x-y)^2))
      signum <- sum(sign(x) == sign(y)) == n
      res[i,] <- c(diff,signum)
    }

    res <- res[order(res$r),]

    range <- (1+(n-1)*trials) : (n*trials)
    resPerN$N[range] <- n
    resPerN$r[range] <-  (res$r - min(res$r))/(max(res$r)-min(res$r))

    invprob <-  1/(cumsum(res$signum)/cumsum(1:trials))
    invprob[which(invprob == Inf)] <- 0
    resPerN$prob[range] <- (invprob - min(invprob))/(max(invprob)-min(invprob))
}

xyplot(prob~r,data=resPerN,groups=resPerN$N,type="b",xlab="(min-max-transformed) r",ylab="(min-max-transformed) 1/prob | <= r",auto.key=T,
par.settings=list(superpose.line = list(col = rainbow(5),lty = 1),
          superpose.symbol=list(col = rainbow(5),pch=15,cex=0.8)))

lo que dio lugar a esta trama enter image description here

lo que indica una relación logística (n inversa).

Yendo más allá, recopilando coeficientes beta e interceptos, un par por dimensión, deberías poder derivar una función dependiente de r. Después, yo variaría la desviación típica para incluirla en la ecuación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X