11 votos

"Distribución" de los números $0\leq a\leq b\leq c\leq d\leq 1$

Un amigo vino con el siguiente problema: Considere la posibilidad de $0\leq a\leq b\leq c\leq d\leq 1$ números de tal manera que $a+b+c+d=1$. Hay números $a_{0}$, $b_{0}$, $c_{0}$, $d_{0}$ que minimizar $$|a-a_{0}|+|b-b_{0}|+|c-c_{0}|+|d-d_{0}|$$ most of the time? I mean, if we repeat the process of choosing $un$, $b$, $c$ and $d$ randomly, is there a expected value for $$, $b$, $c$ and $d$? Y qué es?

He intentado iniciar con un problema más fácil, con sólo $a$$b$, de tal manera que $0\leq a\leq b\leq 1$ $a+b=1$ pero yo no tenía ni idea de por donde empezar, así que me decidí a probar con algunos muestreo numérico, y me hizo la siguiente en Python:

Elija un número de $x\in [0,1]$ uniformely, y definir $a=\min\{x,1-x\}$$b=\max\{x,1-x\}$. Claramente $0\leq a\leq b\leq 1$$a+b=1$. Haciendo esto, y repetir un montón de veces conseguí que el "valor esperado" de$a$$0.25$$b$$0.75$, por lo que la proporción es de $1:3$.

A continuación, he probado el mismo en Python, pero con dos valores: Elija $x,y\in [0,1]$ uniformely, y deje $x_{1}=\min\{x,y\}$$x_{2}=\max\{x,y\}$, ahora definir $$A=\{x_{1},x_{2}-x_{1},1-x_{2}\}$$ and let $a_{1}$, $a_{2}$, $a_{3}$ be the elements of $$ in increasing order. Clearly $0\leq a_{1}\leq a_{2}\leq a_{3}\leq 1$, and $a_{1}+a_{2}+a_{3}=1$, and repeting a lot of times I got that the "expected values" were of the ratio $2:5:11$.

Repetir el mismo método, pero ahora con uno más variable conseguí que los "valores esperados" estaban en la relación de $3:7:13:25$.

Por último, y con uno más variable de las proporciones se $12:27:47:77:137$.

Todo esto los cálculos se encontraron sólo por ensayo y error, y claramente no matemáticamente justificado, pero parece que, al menos, una buena conjetura.

¿Hay algún modelo escondido detrás de estas proporciones? ¿Hay alguna razón para este número de a?

Cualquier ayuda se agradece.

4voto

David K Puntos 19172

Sin la clasificación, si usted acaba de elegir a $n$ números aleatorios $x_i$ tal que $0 \leq x_i \leq 1$ $\sum x_i = 1,$ el espacio muestral puede ser representado como un $(n-1)$-dimensiones polytope (específicamente, un simplex) con vértices en $(1,0,0,\ldots,0)$, $(0,1,0,\ldots,0),$ $(0,0,1,0,\ldots,0), \ldots,$ $(0,0,\ldots,0,1).$ (Que es, en cada vértice exactamente una coordenada es $1$ y el resto se $0$.) Una elección obvia de distribución en esta región sería una densidad uniforme.

Creo que tu sin diferencias lograr esta distribución. Lo cierto es que dar el correcto valor esperado para cada variable.

Ahora de aplicar la restricción de que el $x_i \leq x_j$ si $i < j.$ El espacio muestral para estas variables es un pequeño $(n-1)$-dimensional simplex que se puede obtener por "cortar" las partes de la original simplex en que $x_1 > x_2,$ o $x_2 > x_3,$ y así sucesivamente hasta que cortar la parte en que $x_n > x_{n-1}.$

La generación de los sin clasificar diferencias y, a continuación, la clasificación se convierte una distribución uniforme sobre la mayor simplex a una distribución uniforme sobre el más pequeño.

Como un ejemplo, para $n = 3$ el último espacio muestral tiene los vértices en $(0,0,1),$ $\left(0,\frac12,\frac12\right),$ y $\left(\frac13,\frac13,\frac13\right).$ El centro de gravedad de esta tabla es $\left(\frac19,\frac{5}{18},\frac{11}{18}\right),$ con las coordenadas en la relación $2:5:11.$

Para $n=4$ los vértices son $(0,0,0,1),$ $\left(0,0,\frac12,\frac12\right),$ $\left(0,\frac13,\frac13,\frac13\right),$ y $\left(\frac14,\frac14,\frac14,\frac14\right).$ Para $n=5$ los vértices se $(0,0,0,0,1),$ $\left(0,0,0,\frac12,\frac12\right),$ $\left(0,0,\frac13,\frac13,\frac13\right),$ $\left(0,\frac14,\frac14,\frac14,\frac14\right),$ y $\left(\frac15,\frac15,\frac15,\frac15,\frac15\right),$ y así sucesivamente para las grandes $n.$

En resumen, cada vértice se obtiene al maximizar el valor de $x_i$ para una $i.$ Debe quedar claro que para $n$ variables, el $i$th de coordenadas de la centroide de la final del simplex, $i = 1, 2, \ldots, n,$ es $$ \frac1n\left(\sum_{j=1}^{n} \frac1j - \sum_{j=1}^{n-i} \frac1j\right). $$


Desde resumiendo términos de la serie armónica puede ser un poco doloroso, aquí está una manera más simple de generar las proporciones. Denotar la diferencia entre los valores esperados de $x_{i+1}$ $x_i$ por $\Delta_i = E(x_{i+1}) - E(x_i).$ Observe que si tomamos el valor esperado de $x_1,$ y seguirlo por el aumento de la secuencia de estas diferencias, tenemos una secuencia de números en la relación de $$ E(x_i) : \Delta_1 : \Delta_2 : \cdots : \Delta_{n-3} : \Delta_{n-2} : \Delta_{n-1} = \frac1n : \frac{1}{n-1} :\frac{1}{n-2} : \cdots: \frac13 : \frac12 : 1. \etiqueta{*} $$

Con el fin de hacer que la relación en el lado derecho una relación de números enteros, nosotros solo es necesario multiplicar cada parte por el mínimo común múltiplo de a $\{1,2,3,\ldots, n\}.$

Por ejemplo, para $n = 5,$ nos encontramos con que el mínimo común múltiplo de $\{1,2,3,4,5\}$ $60.$ La proporción de $(^*)$ es por lo tanto $$ \frac15 : \frac14 :\frac13 :\frac12 : 1 = \frac{60}{5} : \frac{60}{4} :\frac{60}{3} :\frac{60}{2} : 60 = 12 : 15 : 20 : 30 : 60. $$

Ahora, recordando que, excepto para la primera parte de esta relación, cada parte es proporcional a la diferencia entre dos consecutivos valores esperados, y la observación de que $E(x_k) = E(x_1) + \sum_{i=1}^{k-1} \Delta_i,$ vamos a reemplazar la relación con un cociente de sumas parciales: $$ 12 : 15 : 20 : 30 : 60 \a 12 : 27 : 47 : 77 : 137, $$ y ahí está la relación.

1voto

Parece que el proceso es el siguiente:

  • elija $n-1$ valores de forma independiente y de manera uniforme en $[0,1]$
  • ordenar estos valores a la orden
  • encontrar las brechas entre los sucesivos valores ordenados, y entre el $0$ y el más pequeño, y entre el más grande y $1$, por lo que calcular el $n$ no negativo lagunas sumando $1$
  • ordenar estas brechas en orden
  • considerar los valores esperados de estos se ordenan las lagunas

Para lo que vale, creo que el $n$ lagunas (antes de la clasificación) tienen idénticos, pero no independiente de las distribuciones con densidad de $f(x)=n(1-x)^{n-1}$ al$0 \le x \le 1$, por lo que la media de $\frac{1}{n}$

Se le pidió una explicación de las relaciones de patrón observado. Empíricamente parece que la duración esperada de la $k$th ordenan la brecha de $n$ está relacionado con la diferencia de dos armónica de los números de $$\frac{1}{n}\left(\sum_{i=1}^{n} \frac1{i} - \sum_{j=1}^{n-k} \frac1{j} \right) \\ = \sum_{j=n-k+1}^{n} \frac1{nj} $$

Así en el ejemplo inicial con $n=4$, se obtiene para diferentes valores de $k$:

  1. : $\frac1{4\times4} = \frac1{16} = \frac{3}{48}$
  2. : $\frac1{4\times3}+\frac1{4\times4} = \frac{7}{48}$
  3. : $\frac1{4\times2}+\frac1{4\times3}+\frac1{4\times4} = \frac{13}{48}$
  4. : $\frac1{4\times1}+\frac1{4\times2}+\frac1{4\times3}+\frac1{4\times4} = \frac{25}{48}$

la reproducción de su $3:7:13:25$ ratios. Esto sucede con los otros valores de $n$

Creo que estos valores esperados no minimizar $\mathbb E [ |a-a_{0}|+|b-b_{0}|+|c-c_{0}|+|d-d_{0}| ]$ pero sí minimizar $\mathbb E[(a-a_{0})^2+(b-b_{0})^2+(c-c_{0})^2+(d-d_{0})^2]$

Para minimizar la espera absoluto sumas creo que le iría mejor con las medianas de las distribuciones de la orden de las lagunas, y sospecho que estos medianas no pueden agregar hasta $1$ al $n \gt 2$. Así, por ejemplo, con $n=4$ de los medios acerca de la $0.0625, 0.1458, 0.2708, 0.5208$, pero las medianas parecen experimentalmente para estar más cerca de algo parecido a $0.052, 0.145, 0.276, 0.500$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X