5 votos

Existencia de una distribución conjunta en variables Bernoulli con la misma probabilidad de ser diferentes por pares

Sea $m\in\mathbb{N}$ y $p\in(0,1)$ ser arbitraria. ¿Existe una secuencia $X_1,\dots,X_m$ de variables aleatorias con las siguientes especificaciones en su distribución:

  • Cada $X_i$ es Bernoulli insesgado: $X_i\sim {\rm Ber}(1/2)$ para $1\le i\le m$ .
  • $\mathbb{P}\bigl[X_i=X_j\bigr] = p$ para todos $1\le i<j\le m$ .

6voto

Iosif Pinelis Puntos 24742

$\newcommand{\R}{\mathbb R}\renewcommand{\le}{\leqslant}\renewcommand{\ge}{\geqslant}$ Sea $n:=m\ge2$ . Demostraremos que la condición deseada se cumple si y sólo si $$p\ge\frac{\lceil n/2\rceil-1}{2 \lceil n/2\rceil-1}.$$

Supongamos por un momento que existen variables aleatorias $X_1,\dots,X_n$ tal que $X_i\sim {\rm Ber}(1/2)$ para todos $i$ y $P(X_i=X_j)=p\in(0,1)$ si $i\ne j$ . Es decir, existe una función no negativa $g\colon\{0,1\}^n\to\R$ tal que

(i) $\sum_{x\in\{0,1\}^n}g(x)=1$ ,

(ii) $\sum_{x\in\{0,1\}^n}1(x_i=0)g(x)=\frac12$ para todos $i$ ,

(iii) $\sum_{x\in\{0,1\}^n}1(x_i=x_j)g(x)=p$ si $i\ne j$ .

Entonces, por simetría, las condiciones (i)--(iii) se cumplirán con $\tilde g(x):=\frac1{n!}\sum_{\pi\in S_n}g(\pi(x))$ en lugar de $g(x)$ donde $S_n$ es el conjunto de todas las permutaciones del conjunto $[n]:=\{1,\dots,n\}$ . Tenga en cuenta que $\tilde g(x)=f(\sum_1^n x_i)$ para alguna función $f\colon\{0,\dots,n\}\to\R$ y todos $x=(x_1,\dots,x_n)\in\{0,1\}^n$ . Además, las condiciones (i)--(iii) pueden reescribirse como

(I) $\sum_{k=0}^n \binom nk f(k)=1$ ,

(II) $\sum_{k=0}^n \binom{n-1}k f(k)=\frac12$ para todos $i$ ,

(III) $\sum_{k=0}^n a_{n,k} f(k)=p$ ,

donde \begin{equation} a_{n,k}=\binom{n-2}k+\binom{n-2}{k-2}; \end{equation} por supuesto, $\binom{n-2}k=0$ si $k\ge n-1$ y $\binom{n-2}{k-2}=0$ si $k\le1$ .

Así, para cualquier $n\ge2$ y $p\in(0,1)$ queremos ver si existe una función no negativa $f\colon\{0,\dots,n\}\to\R$ de forma que se cumplan las condiciones (I)--(III).

Considere las relaciones \begin{equation} r_k:= r_{n,k}:=\frac{a_{n,k}}{\binom nk} =\frac{(n-k)(n-k-1)+k (k-1)}{n (n-1)}. \end{equation} Tenga en cuenta que $r_{k+1}\le r_k$ si $0\le k\le\frac{n-1}2$ y $r_{k+1}\ge r_k$ si $\frac{n-1}2\le k\le n-1$ . También, $r_k=r_{n-k}$ .

De ello se deduce que

  • el máximo, digamos $\overline p_n$ de $\sum_{k=0}^n a_{n,k} f(k)$ sobre todas las funciones no negativas $f\colon\{0,\dots,n\}\to\R$ tal que se cumpla la condición (I) se alcanza si $f(0)=f(n)=\frac12$ y $f_1=\cdots=f_{n-1}=0$ y, por tanto $\overline p_n=1$ Además, también se cumple la condición (II);

  • si $n=2m$ es par, entonces el mínimo, digamos $\underline p_n$ de $\sum_{k=0}^n a_{n,k} f(k)$ sobre todas las funciones no negativas $f\colon\{0,\dots,n\}\to\R$ tal que se cumpla la condición (I) se alcanza si $f(m)=1/\binom nm=1/\binom{2m}m$ y $f_k=0$ para $k\in\{0,\dots,n\}\setminus\{m\}$ y, por tanto $\underline p_n=\underline p_{2m}=\frac{m-1}{2m-1}$ Además, también se cumple la condición (II);

  • si $n=2m+1$ es impar, entonces el mínimo $\underline p_n$ de $\sum_{k=0}^n a_{n,k} f(k)$ sobre todas las funciones no negativas $f\colon\{0,\dots,n\}\to\R$ tal que se cumpla la condición (I) se alcanza si $f(m)=f(m+1)=\frac12/\binom{2m+1}m=\frac12/\binom{2m+1}{m+1}$ y $f_k=0$ para $k\in\{0,\dots,n\}\setminus\{m,m+1\}$ y, por tanto $\underline p_n=\underline p_{2m+1}=\frac m{2m+1}$ Además, también se cumple la condición (II).

Así que..,

  • el máximo de $\sum_{k=0}^n a_{n,k} f(k)$ sobre todas las funciones no negativas $f\colon\{0,\dots,n\}\to\R$ tal que se cumplan las condiciones (I) y (II) es $\overline p_n=1$ ;

  • si $n=2m$ es par, entonces el mínimo de $\sum_{k=0}^n a_{n,k} f(k)$ sobre todas las funciones no negativas $f\colon\{0,\dots,n\}\to\R$ tal que se cumplan las condiciones (I) y (II) es $\underline p_n=\frac{m-1}{2m-1}$ ;

  • si $n=2m+1$ es impar, entonces el mínimo de $\sum_{k=0}^n a_{n,k} f(k)$ sobre todas las funciones no negativas $f\colon\{0,\dots,n\}\to\R$ tal que se cumplan las condiciones (I) y (II) es $\underline p_n=\frac m{2m+1}$ .

El conjunto de todos los valores de $\sum_{k=0}^n a_{n,k} f(k)$ donde $f\colon\{0,\dots,n\}\to\R$ es una función no negativa tal que se cumplen las condiciones (I) y (II), es convexa y por tanto coincide con el intervalo $[\underline p_n,\overline p_n]=[\underline p_n,1]$ .

Por lo tanto, las dos condiciones siguientes son equivalentes entre sí:

  • existe una función no negativa $f\colon\{0,\dots,n\}\to\R$ de forma que se cumplan las condiciones (I)--(III);

  • $\underline p_n\le p\le1$ .

Es decir, para cada $n\ge2$ y cada $p\in[0,1]$ las dos condiciones siguientes son equivalentes entre sí:

  • existen variables aleatorias $X_1,\dots,X_n$ tal que $X_i\sim {\rm Ber}(1/2)$ para todos $i$ y $P(X_i=X_j)=p$ si $i\ne j$ ;

  • $p\ge \underline p_n$ .

También cabe señalar que

  • $\underline p_n=\dfrac{m_n-1}{2m_n-1}$ donde $m_n:=\lceil n/2\rceil$ ;

  • $\underline p_n\le\underline p_{n+1}<\frac12$ para todos $n\ge2$ ;

  • $\underline p_n\to\frac12$ como $n\to\infty$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X