31 votos

Longitud media del segmento más largo

Este post está relacionado con otro anterior de SE Si una cuerda de 1 metro . relativa a la longitud media de un segmento más pequeño.

Una cuerda de 1 m se divide en tres trozos por dos puntos aleatorios. Halla la longitud media del segmento mayor. Mi respuesta es 11/18. He aquí cómo lo hago:

Aquí tenemos dos variables aleatorias independientes $X,Y$ ambos uniformes en $[0,1]$ . Sea $A=\min (X,Y), B=\max (X,Y)$ y $C=\max (A, 1-B, B-A)$ . Primero queremos encontrar la función de densidad de probabilidad de probabilidad $f_C(a)$ de $C$ . Sea $F_C(a)$ sea la función de distribución acumulativa. Entonces $$ F_C(a) = P(C\le a)=P(A\le a, 1-B\le a, B-A\le a).$$ Reescribiendo esta probabilidad como área en la unidad cuadrada, obtengo $$F_C(a)=\left\{\begin{array}{ll} (3a-1)^2 & \frac{1}{3}\le a\le \frac{1}{2}\\ 1-3(1-a)^2 & \frac{1}{2}\le a\le 1\end{array}\right.$$ de lo que se deduce que $$f_C(a)=\left\{\begin{array}{ll} 6(3a-1) & \frac{1}{3}\le a\le \frac{1}{2}\\ 6(1-a) & \frac{1}{2}\le a\le 1\end{array}\right.$$ Por lo tanto el valor esperado de $C$ es $$\int_{1/3} ^{1/2}6a(3a-1) da+\int_{1/2} ^{1}6a(1-a) da= \frac{11}{18}.$$

Mis preguntas son:

(A) ¿Hay alguna forma "inteligente" de averiguar este número 11/18?

(B) ¿Cuál es la respuesta si la cuerda se divide en $n>3$ ¿Segmentos?

25voto

Martin OConnor Puntos 116

La respuesta a (B) se da en realidad tanto en las respuestas de Yuval Filmus como en las mías a la pregunta sobre la longitud media del segmento más corto . Es $$\frac{1}{n} H_n,$$ donde $H_n = \sum_{k=1}^n \frac{1}{k},$ es decir, el $n$ th número armónico .


"Inteligente" es, por supuesto, subjetivo, pero he aquí un argumento a favor de (A) en el $n$ -estuche. Al menos sólo hay una integración (de una sola variable) en él. :)

Si $X_1, X_2, \ldots, X_{n-1}$ denotan las posiciones de la cuerda en las que se realizan los cortes, sea $V_i = X_i - X_{i-1}$ donde $X_0 = 0$ y $X_n = 1$ . Así que el $V_i$ son las longitudes de los trozos de cuerda.

La idea clave es que la probabilidad de que cualquier $k$ de la $V_i$ tienen simultáneamente longitudes superiores a $c_1, c_2, \ldots, c_k$ respectivamente (donde $\sum_{i=1}^k c_i \leq 1$ ), es $$(1-c_1-c_2-\ldots-c_k)^{n-1}.$$ Esto se demuestra formalmente en la obra de David y Nagaraja _Estadísticas de pedidos_ , p. 135. Intuitivamente, la idea es que para tener piezas de tamaño al menos $c_1, c_2, \ldots, c_k$ todos $n-1$ de los cortes tienen que producirse en intervalos de la cuerda de longitud total $1 - c_1 - c_2 - \ldots - c_k$ . Por ejemplo, $P(V_1 > c_1)$ es la probabilidad de que todos $n-1$ cortes se producen en el intervalo $(c_1, 1]$ que, dado que los cortes se distribuyen aleatoriamente en $[0,1]$ es $(1-c_1)^{n-1}$ .

Si $V_{(n)}$ denota el trozo de cuerda más grande, entonces $$P(V_{(n)} > x) = P(V_1 > x \text{ or } V_2 > x \text{ or } \cdots \text{ or } V_n > x).$$ Para ello es necesario principio de inclusión/exclusión . Así tenemos, utilizando la "idea clave" anterior, $$P(V_{(n)} > x) = n(1-x)^{n-1} - \binom{n}{2} (1 - 2x)^{n-1} + \cdots + (-1)^{k-1} \binom{n}{k} (1 - kx)^{n-1} + \cdots,$$ donde la suma continúa hasta $kx > 1$ .

Por lo tanto, $$E[V_{(n)}] = \int_0^{\infty} P(V_{(n)} > x) dx = \sum_{k=1}^n \binom{n}{k} (-1)^{k-1} \int_0^{1/k} (1 - kx)^{n-1} dx = \sum_{k=1}^n \binom{n}{k} (-1)^{k-1} \frac{1}{nk} $$ $$= \frac{1}{n} \sum_{k=1}^n \frac{\binom{n}{k}}{k} (-1)^{k-1} = \frac{H_n}{n},$$ donde el último paso aplica un identidad de la suma binómica .

19voto

Ronnie268 Puntos 123

Por muy buena que sea, no creo que la respuesta de Rahul pueda ser correcta. Si tenemos $3x+2y+z=1$ y $3x+2y+z=9n$ entonces $n=1/9$ lo que significa $x \leq 2/9$ lo cual no puede ser correcto, ya que una solución es que todas las piezas tengan una longitud de 1/3 (por muy improbable que sea esta solución exacta, $x$ puede tomar valores en $(2/9,1/3]$ ).

La respuesta de Stefan es incorrecta porque la probabilidad de que un punto cualquiera del palo esté en el trozo más largo (cuando se corta en 2) no es uniforme. Eso se puede ver considerando el punto situado a mitad de camino, que siempre está en el trozo más largo. Puedes hallar la función de densidad de probabilidad para la probabilidad de que un punto dado esté en la mitad más larga, y luego integrarla para obtener la respuesta que se muestra a continuación.

Mi solución preferida es dejar que los recortes sean a $X, Y$ con $Y \gt X$ :

Imagen de posiciones cortadas

Entonces cada pieza tiene la misma probabilidad de ser la más larga, y la longitud esperada de la pieza más larga no depende de la pieza que elijamos. Entonces podemos calcular $\mathop{\mathbb{E}}(X|X \text{ is the longest piece} )$ .

Tenemos las tres desigualdades: $$X \gt Y-X \implies Y < 2X$$ $$X \gt 1-Y \implies Y > 1-X$$ y, desde nuestra configuración, $$Y \gt X$$ Pueden representarse mediante el siguiente diagrama:

Diagrama de desigualdades

Entonces el área que satisface nuestras desigualdades son los dos triángulos A y B. Así que deseamos encontrar el valor esperado de $X$ dentro de esta zona.

El valor esperado de $X$ en A es $\bar{X}_A = \frac{1}{2}-\frac{1}{3}(\frac{1}{2}-\frac{1}{3}) = \frac{8}{18}$ .

El valor esperado de $X$ en B es $\bar{X}_B = \frac{1}{2}+\frac{1}{3}(\frac{1}{2}) = \frac{4}{6} = \frac{12}{18}$

El área de A es $A_A = \frac{1}{2} \times \frac{1}{2}\times (\frac{1}{2}-\frac{1}{3}) = \frac{1}{24}$ .

El área de B es $A_B = \frac{1}{2} \times \frac{1}{2}\times \frac{1}{2} = \frac{1}{8} = \frac{3}{24} = 3 A_A$ .

Así que $\mathop{\mathbb{E}}(X|X \text{ is the longest piece} ) = \frac{\tfrac{8}{18} + 3\left(\tfrac{12}{18}\right)}{4} = \frac{11}{18}$

(Disculpas por los comentarios sobre otras soluciones y los enlaces, pero no tengo la reputación suficiente para comentar o incrustar directamente)

10voto

Rahul Madhavan Puntos 113

Una respuesta más intuitiva. Ordenemos los segmentos de menor a mayor. Sean los tres segmentos $x$ , $x+y$ y $x+y+z$ .

${\rm sum\ of\ segments}$ = 1 $\implies 3x + 2y + z = 1$ ;

sujeto a las restricciones: $x\geqslant 0,y \geqslant 0,z \geqslant 0$ $\implies x \leqslant 1/3 , y \leqslant 1/2, z \leqslant 1$ .

Dentro de estos límites, podemos suponer $x$ , $y$ y $z$ puede tomar cualquier valor siempre que renormalicemos la longitud total para que sea igual a 1, como si construyéramos la cadena más grande a partir de sus partes constituyentes. Estos límites relativos equivalen a lo siguiente:

Sea $x$ se elegirán al azar entre un grupo de $[0,2n]$ , $y$ se elegirán al azar de un grupo $[0,3n]$ y $z$ de una piscina $[0,6n]$ donde $(x,y,z,n)$ $\in$ $\mathbb R$ .

Valor esperado de $x = n$ valor esperado de $y = 1.5n$ y valor esperado de $z = 3n$ .
Longitud prevista del segmento más largo = $x+y+z = 5.5n$
Longitud total prevista = $3x+2y+z = 9n$

Por lo tanto, la longitud esperada del segmento más largo es

$(x+y+z)/(3x+2y+z)= 5.5/9= 11/18 $ .

La longitud esperada del segmento más corto es

$x/(3x+2y+z) = 1/9$ .

2voto

Illep Puntos 101

¿Por qué es errónea esta respuesta?

Sea la longitud del segmento más largo creado por el PRIMER corte $L_1$ . Consideremos ahora el segundo corte. Con probabilidad $(1-L_1)$ estará en el segmento más corto hecho por el primer corte, y el más largo de los 3 segmentos tendrá entonces longitud $L_1$ .

Por otra parte, con probabilidad $L_1$ el segundo corte será en el primer segmento más largo, y el más largo de los 3 segmentos será entonces el máximo del segmento más largo hecho por el segundo corte, llámalo $L_2$ o el segmento más corto realizado por el primer corte, de longitud $(1-L_1)$ .

Esto da una longitud esperada del segmento más largo como: $(1-L_1)L_1+L_1 \max[L_2,(1-L_1)]$ . Si ahora calculamos la media de las posiciones de corte, es fácil deducir que $L_1=3/4$ y $L_2=L_1^2=9/16$ con lo que la longitud media del segmento más largo es de 39/64. Esto no coincide con 11/18, ¡pero sólo en un 0,3%!

Supongo que hay un problema al realizar el "promedio" sobre el $\max$ función, pero no entiendo por qué. ¡Cualquier comentario sería genial! ¡¡¡Gracias!!!

0voto

Rob Abramovic Puntos 10

Tengo otra idea para el caso en que el palo se divide en $n$ piezas: dejar $X_{i}$ $1 \leq i \leq n$ sean las notas de corte, que son variables distribuidas aleatoriamente de forma independiente entre $0$ y $1$ y fijar $A=max{X_{i}}$ . Consideremos ahora las dos piezas, una de longitud $A$ y la otra de longitud $1-A$ . La pieza de longitud $A$ se subdivide en $n-1$ mientras que el de longitud $1-A$ permanece íntegro. Si $1-A>A$ entonces el trozo de longitud $1-A$ será el más largo (obviamente). Si $1-A<A$ entonces el trozo más largo es el máximo de la subdivisión más larga en $A$ y el de longitud $1-A$ . Sea $L_{n}$ denotan la longitud del segmento más largo de un palo de longitud unitaria dividido en $n$ piezas. Dado que la longitud de la subdivisión más larga en el palo de longitud $A$ es $AL_{n-1}, obtenemos la siguiente fórmula:

$$E(L_{n})=P(1-A>A)E(1-A)+P(1-A<A)E(\max(AL_{n-1}, 1-A))$$

Desde el $X_{i}$ son independientes, la FDA de $A$ es $F_{A}(y)=y^{n}$ y el PDF es $ny^{n-1}$ de modo que obtenemos: $$E(A)= \int_{0}^{1} ny^{n} dy = \frac{ny^{n+1}}{n+1}|_{0}^{1}=\frac{n}{n+1}$$ . Por lo tanto, $P(1-A>A)=P(A<\frac{1}{2})=\frac{1}{2^{n}}$ de modo que $P(1-A<A)=1-\frac{1}{2^{n}}$ . Ahora, $E(1-A)=E(1)-E(A)=1-\frac{n}{n+1}=\frac{n+1-n}{n+1}=\frac{1}{n+1}$ . Por lo tanto, la fórmula anterior para $E(L_{n})$ se reduce a:

$$E(L_{n})=\frac{1}{2^{n}(n+1)}+(1-\frac{1}{2^{n}})(E(\max(AL_{n-1}, 1-A))$$

Ahora a ocuparse de $E(\max(AL_{n-1}, 1-A)$ , dejemos que $f_{L_{n-1}}$ denota la PDF de la variable aleatoria $L_{n-1}$ . Creo que podemos asumir que $A$ y $L_{n-1}$ son independientes. Si este es el caso, dejemos que $M=\max(AL_{n-1},1-A)$ y observe el siguiente hecho: si $a=L_{n-1}$ es fijo, entonces $P(M \leq y)= P(1-y \leq A \leq \frac{y}{a}) = F_{A}(\frac{y}{a})-F_{A}(1-y)=(\frac{y}{a})^{n}-(1-y)^{n}$ . Por lo tanto, obtenemos la siguiente FCD para $M$ : $$F_{M}(y)=\int_{\frac{1}{n-1}}^{1} [\frac{y^{n}}{a^{n}}-(1-y)^{n}]f_{L_{n-1}}(a) da$$ Obsérvese que el límite inferior $\frac{1}{n-1}$ sobre la integral se justifica por el hecho de que el trozo más largo sobre el trozo de una cuerda de longitud unitaria cortada en $n-1$ piezas deben ser más largas que $\frac{1}{n-1}$ . Extracción de factores que no dependen de $a$ de la integral anterior se obtiene:

$$F_{M}(y) = y^{n}\int_{\frac{1}{n-1}}^{1} \frac{f_{L_{n-1}}(a)}{a^{n}}da-(1-y)^{n}\int_{\frac{1}{n-1}}^{1}f_{L_{n-1}}(a)da$$

De la definición de función de densidad de probabilidad se deduce que $\int_{\frac{1}{n-1}}^{1}f_{L_{n-1}}(a)da=1$ y reconocemos además $\int_{\frac{1}{n-1}}^{1} \frac{f_{L_{n-1}}(a)}{a^{n}}da$ como $E(\frac{1}{L_{n-1}^{n}})$ . Así obtenemos: $$F_{M}(y)=y^{n}E(\frac{1}{(L_{n-1})^{n}})-(1-y)^{n}$$ Diferenciación $F_{M}(y)$ obtenemos el siguiente PDF, $f_{M}(y)$ para $M$ : $$f_{M}(y)=ny^{n-1}E(\frac{1}{(L_{n-1})^{n}})+n(1-y)^{n-1}$$ para poder calcular $E(M)$ :

$$E(M)=E(\frac{1}{(L_{n-1})^{n}})\int_{\frac{1}{n}}^{1} ny^{n} dy + \int_{\frac{1}{n}}^{1} ny(1-y)^{n-1} dy$$

Calculamos $$\int_{\frac{1}{n}}^{1} ny^{n} dy = \frac{ny^{n+1}}{n+1}|_{\frac{1}{n}}^{1}= \frac{n}{n+1}-\frac{n(1/n)^{n+1}}{n+1}=\frac{n}{n+1}-\frac{1}{n^{n}(n+1)}$$

Encontrando un denominador común para las dos fracciones anteriores, obtenemos

$$\int_{\frac{1}{n}}^{1} ny^{n} dy = \frac{n^{n+1}-1}{n^{n}(n+1)}$$

A partir del integrador de wolfram alpha, calculé

$$\int_{\frac{1}{n}}^{1} ny(1-y)^{n-1} dy = \frac{2(n-1)^{n}}{n^{n}(1+n)}$$

Podemos concluir entonces que

$$E(M)=\frac{(n^{n+1}-1)E(\frac{1}{(L_{n-1})^{n}})+2(n-1)^{n}}{n^{n}(n+1)}$$

Introduciendo este valor en la fórmula para $E(L_{n})$ obtenemos:

$$E(L_{n})=\frac{1}{2^{n}(n+1)}+(1-\frac{1}{2^{n}(n+1)})\frac{(n^{n+1}-1)E(\frac{1}{(L_{n-1})^{n}})+2(n-1)^{n}}{n^{n}(n+1)}$$

Combinando las dos fracciones utilizando el denominador común de $(2n)^{n}(n+1)^{2}$ obtenemos

$$E(L_{n})=\frac{n^{n}(n+1)+(2^{n}(n+1)-1)((n^{n+1}-1)(E(\frac{1}{(L_{n-1})^{n}})+2(n-1)^{n})}{(2n)^{n}(n+1)^{2}}$$

Sin embargo, para que esta fórmula de recursión sea útil, necesito poder escribir $E(\frac{1}{(L_{n-1})^{n}}$ en términos de $E(L_{n-1})$ . He calculado que $E(\frac{1}{(L_{2})^{3}})=3$ y que $E(\frac{1}{(L_{2})^{4}})=12$ pero no sé en general cómo $E(L_{n-1})$ se refiere a $E(L_{n})$ ¿alguien tiene alguna idea de cómo hacerlo? Por favor, hágamelo saber. Gracias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X