12 votos

Probabilidad de que el producto de las medias sea mayor que el producto del máximo y el mínimo

Dado $X_1,...,X_n \stackrel{iid}{\sim} \text{Unif}(a,b)$ ¿Qué es? $$\mathbb{P}\left[\frac{\sum x_i}{\sum \frac{1}{x_i}} \geq \max(x_i) \cdot \min(x_i)\right].$$ No necesito una fórmula de forma cerrada, sólo una descripción del comportamiento asintótico estaría bien. Los experimentos numéricos parecen mostrar que la probabilidad tiende a 1.

Aquí $a,b$ son arbitrarios. Como ha señalado wolfies en los comentarios, cuando $a=0$ el resultado es inmediato ya que $\min(x_i)\to 0$ . Así que podemos suponer $a>0$ . La desigualdad es invariable por el escalamiento, por lo que podemos suponer, por ejemplo, que $a=1$ y $b$ es arbitraria.

Un poco de historia : Estoy estudiando un algoritmo que tiene parámetros $x_i \in \Bbb R_+, i =1,...,n$ . El algoritmo tiene un buen rendimiento demostrable cuando $$\frac{\sum x_i}{\sum \frac{1}{x_i}} \geq \max(x_i) \cdot \min(x_i).$$ El lado izquierdo puede escribirse como $AM(x_i) \cdot HM(x_i)$ donde $AM$ y $HM$ son las medias aritméticas y armónicas. Ambas cantidades están entre $\min(x_i)$ y $\max(x_i)$ Así que no se puede decir nada de su producto en general.

Sin embargo, las evidencias numéricas parecen indicar que el evento ocurre con probabilidad uno como $n\to \infty$ si el $x_i$ se muestrean uniformemente. Pero no soy capaz de encontrar una prueba de este hecho.

0 votos

¿Qué quiere decir con $Unif(a,b)$ ? Uniforme distribuido en $(a,b)$ o en la imagen de $(a,b)$ bajo la transformación $f$ .

0 votos

La distribución uniforme en el intervalo $(a,b)$ .

0 votos

No estoy seguro de que $a$ y $b$ son arbitrarios. Si $a$ es 0 (como en la publicación original de esta pregunta), entonces el mínimo muestral tiende a 0 como $n$ se hace grande, por lo que el RHS tiende a 0 también, por lo que el resultado se mantiene trivialmente (ya que las medias de la muestra son estrictamente positivas).

3voto

Will Green Puntos 758

$X \sim \text{Uniform}(a,b)$ $\dots$ suponer que, por ejemplo $a=1$ y $b$ es arbitrario

Dejemos que $X \sim \text{Uniform}(1,b)$ y que ${X_1, \dots, X_n}$ denotan una muestra aleatoria de tamaño $n$ sobre los padres $X$ .

RHS

Como $n$ se hace grande, el máximo de la muestra tiende a $b$ y el mínimo de la muestra a 1, por lo que el producto $$\max(x_i) \cdot \min(x_i) \quad \to \quad b$$

También se puede derivar formalmente el pdf de $\max(x_i) \cdot \min(x_i)$ como el producto de los estadísticos de mayor y menor orden (la forma funcional se da en la parte inferior), lo que también puede ser útil, pero no es necesario.

LHS $$\quad \large \frac{\frac{1}{n}\sum x_i}{\frac{1}{n}\sum \frac{1}{x_i}}$$

Si estamos interesados en el comportamiento asintótico (gran muestra), podemos aplicar los conceptos del Teorema Central del Límite.

  • El numerador es la media muestral de $X$ , que tiene un valor esperado: $\large \frac{b+1}{2}$

  • El denominador es la media muestral de $1/X$ , que tiene un valor esperado: $\large \frac{\log{b}}{b-1}$

La relación límite entre el numerador y el denominador es: $$\text{LHS} \large = \frac{b^2-1}{2 \log (b)}$$

El siguiente diagrama traza el límite del LHS en función de $b$ . Tenga en cuenta que, dado que $b$ es el límite RHS, estamos trazando el límite LHS en función del límite RHS:

enter image description here

[ La curva naranja es la identidad $b=b$ ]

... lo que completa la prueba: el límite LHS supera el límite RHS, para todo $b > 1$ . El diagrama también sugiere que, cuanto más grande es $b$ cuanto mayor sea la probabilidad de que la relación de las medias de las muestras supere el producto del rango de la muestra.


Comprobación de Monte Carlo

Una comprobación de Monte Carlo es informativa para verificar la tasa de convergencia, y para confirmar los límites anteriores.

En lo siguiente:

  • $n = 500$
  • la curva azul es una aproximación de Montecarlo de la función del coeficiente LHS
  • la curva roja es una aproximación de Montecarlo de la función de los datos del lado derecho $\max(x_i) \cdot \min(x_i)$ .

enter image description here

Como se ha argumentado anteriormente:

  • la curva roja está centrada en $b$ , donde $b =2$ en el diagrama superior, y $b = 4$ en el diagrama inferior.

  • la curva azul aparece Normal (según CLT) con modo en $\frac{b^2-1}{2 \log (b)}$ que es $\approx 2.164$ cuando $b = 2$ (diagrama superior), y $\approx 5.41$ cuando $b = 4$ (diagrama inferior).

Comparación de muestras pequeñas

El siguiente diagrama compara la pequeña muestra de pdf de los dos productos:

enter image description here

cuando $b = 2$ . Esta vez, la curva roja discontinua es el pdf exacto del producto de la muestra mínima y máxima.


CDF exacta del producto de la muestra mínima y máxima

Dado un padre uniforme, digamos con $b=2$ :

f = 1;  domain[f] = {x, 1, 2}; 

... podemos encontrar el pdf conjunto de la muestra mínima y la muestra máxima (estoy usando aquí la función estadística de orden de mathStatica para automatizar) como:

enter image description here

Dejemos que $Z = X_1 X_n$ denotan el producto de la muestra mínima y máxima. Entonces la fdc de $Z$ , $P(Z<z)$ es:

enter image description here

El pdf se puede obtener entonces diferenciando wrt $z$ . Este último se utilizó para trazar las curvas rojas exactas que aparecen arriba. Quizá deba señalar que soy uno de los autores del software utilizado aquí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X