6 votos

Diferencia entre las variables aleatorias de Bernoulli.

Dado son $n$ variables aleatorias de Bernoulli independientes con parámetros de $p_1,\dots,p_n$. Queremos dividir en dos partes, de modo de minimizar la expectativa $\mathbb{E}[|X-Y|]$, donde $X$ es la suma de la primera parte y $Y$ la suma de la segunda parte.

¿Cuál es la mejor manera de dividir, de manera que esta expectativa se reduce al mínimo? Una razonable conjetura es que es siempre hacer que las sumas de los parámetros de $p_i$'s en las dos piezas tan cerca como sea posible. Hay ejemplos en los que esta no es la óptima?

4voto

antkam Puntos 106

ACTUALIZACIÓN: Hay un contra-ejemplo!

El conjunto es $[p_i] = [0.24, 0.24, 0.24, 0.28, 0.5, 0.5],$ y me considera dos divisiones. El primero es un perfecto split ($E[X-Y] = 0$), mientras que el segundo no lo es. Si mi código no tiene errores, aquí están los valores pertinentes, con mínimos en rojo.

$$ \begin{matrix} \text{Split} & E[|X-Y|^2] & E[|X-Y|] & E[X-Y] \\ [0.24, 0.24, 0.24, 0.28] \text{ vs } [0.5, 0.5] & \color{red}{1.2488} &0.84330 & \color{red}{0} \\ [0.24, 0.24, 0.5] \text{ vs } [0.24, 0.28, 0.5] & 1.2504 & \color{red}{0.84003} & 0.04 \end{de la matriz} $$

Así el perfecto split ($E[X-Y] = 0$) minimiza $E[|X-Y|^2]$ como mis antiguos respuesta demostrado. Sin embargo, el imperfecto dividir en realidad tiene un menor $E[|X-Y|]$.

Especulación: lo que ocurre Es que $P(X-Y=0)$ es mayor para el imperfecto split ($0.3476$) que para el perfecto split ($0.3429$). Me pregunto si esto tiene alguna relación con la pregunta. También, me pregunto si algún tipo de "simetría" juega un papel importante, aunque no me molesta para calcular el sesga.

P. S. he encontrado teniendo en cuenta las $[0.25, 0.25, 0.25, 0.25, 0.5, 0.5]$ y la evaluación de los dos diferentes perfecto divisiones. Como mi mayor respuesta muestra, tanto perfecto divisiones tienen el mismo $E[|X-Y|^2]$ valor. Pero como yo esperaba, tienen diferentes $E[|X-Y|]$ valores. Entonces simplemente me perturban un poco para llegar a la contra-ejemplo.


ORIGINAL: No una respuesta, pero demasiado largo para un comentario.

No sé cómo minimizar $E[|X-Y|]$, pero su intuición (dividir el $p_i$'s tan uniformemente como sea posible) reduce en realidad a$E[|X-Y|^2]$. Tenga en cuenta que los dos no son la misma cosa en general.

  • $E[|X-Y|^2] = E[(X-Y)^2] = E[X-Y]^2 + Var(X-Y)$

  • $E[X-Y] = \sum_{i \in \mathcal{X}} p_i - \sum_{j \in \mathcal{Y}} p_i,$ lo $E[X-Y]^2$ se minimiza cuando la $p_i$'s son tan uniformemente como sea posible. (Tenga en cuenta que este es conceptualmente simple, pero computacionalmente... NP-completos, creo.)

  • Mientras tanto, $Var(X - Y) = Var(X) + Var(Y) = Var(X+Y) = \sum_{all\ i} p_i (1-p_i) =$ constante. Así que esto no figura en la minimización.

En conclusión: la división de ellos tan uniformemente como sea posible minimiza $E[|X-Y|^2]$.

Más ideas: Desde $E[|X-Y|^2] = E[|X-Y|]^2 + Var(|X-Y|),$ cualquier contra-ejemplo sería tal que la óptima (desigual) de split tiene mayor $E[|X-Y|^2]$, superior, $Var(|X-Y|)$, pero inferior $E[|X-Y|]$, en comparación con el incluso dividir.

Me encontré con una situación bastante improbable (perdón por el juego de palabras), pero no tengo una prueba de cualquier manera.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X