Vamos a investigar la gama de $x_1\le x_2 \le \cdots \le x_n$ dado que su media aritmética (AM) es un pequeño múltiplo $1+\delta$ de su media geométrica (MG) (con $\delta \ge 0$ ). En la pregunta, $\delta\approx 0.001$ pero no sabemos $n$ .
Dado que la relación de estas medias no cambia cuando se modifican las unidades de medida, elija una unidad para la que el GM sea $1$ . Así, buscamos maximizar $x_n$ con la condición de que $x_1+x_2+\cdots+x_n = n(1+\delta)$ y $x_1\cdot x_2\cdots x_n = 1$ .
Esto se hará haciendo $x_1=x_2=\cdots=x_{n-1}=x$ , digamos, y $x_n=z \ge x$ . Así,
$$n(1+\delta) = x_1 + \cdots + x_n = (n-1)x + z$$
y
$$1 = x_1\cdot x_2 \cdots x_n = x^{n-1}z.$$
La solución $x$ es una raíz entre $0$ y $1$ de
$$(1-n)x^n + n(1+\delta)x^{n-1} - 1.$$
Se encuentra fácilmente de forma iterativa. Aquí están los gráficos del óptimo $x$ y $z$ en función de $\delta$ para $n=6, 20, 50, 150$ de izquierda a derecha:
Tan pronto como $n$ alcanza cualquier tamaño apreciable, incluso una pequeña proporción de $1.001$ es consistente con un gran periférico $x_n$ (las curvas rojas superiores) y un grupo de $x_i$ (las curvas azules inferiores).
En el otro extremo, supongamos que $n=2k$ es par (para simplificar). El alcance mínimo se alcanza cuando la mitad de la $x_i$ igual a un valor $x \le 1$ y la otra mitad es igual a otro valor $z \ge 1$ . Ahora la solución (que se comprueba fácilmente) es
$$x^k = 1+\delta \pm \sqrt{\delta^2 + 2\delta}.$$
Para los pequeños $\delta$ podemos ignorar el $\delta^2$ como una aproximación y también aproximar el $k^\text{th}$ raíz de primer orden, dando
$$x \approx 1 + \frac{\delta-\sqrt{2\delta}}{k};\ z \approx 1 + \frac{\delta+\sqrt{2\delta}}{k}.$$
La gama es aproximadamente $\sqrt{32\delta}/n$ .
De este modo, hemos obtenido límites superiores e inferiores en el rango posible de los datos. Hemos aprendido que dependen en gran medida de la cantidad de datos $n$ . El límite superior muestra que el rango puede ser apreciable incluso para pequeñas $\delta$ Así, podemos saber más sobre la proximidad de los puntos de datos y establecer un límite inferior para su alcance.
Análisis similares, igual de fáciles de realizar, pueden informar cuantitativamente --de lo estrechamente agrupados que están los $x_i$ puede ser en términos de cualquier otra medida de dispersión, como su varianza o coeficiente de variación.
6 votos
Pequeña nota: Primero compruebe que sus datos son todos positivos; un número par de valores negativos podría dejarle con un producto positivo, y algunos paquetes pueden no señalar el problema potencial (la desigualdad AM-GM se basa en que los valores sean todos positivos). Véase por ejemplo (en R):
x=c(-5,-5,1,2,3,10); prod(x)^(1/length(x))
$\:\quad$[1] 3.383363
(mientras que la media aritmética es 1)1 votos
Para profundizar en el punto de @Glen_b, un conjunto de datos $\{-x,0,x\}$ siempre tiene la misma media aritmética y geométrica, es decir, cero. Sin embargo, podemos separar los tres valores tanto como queramos.
0 votos
Tanto la media aritmética como la geométrica tienen la misma fórmula generalizada con $p=1$ dando la primera y $p \rightarrow 0$ dando lo último. Entonces queda claro de forma intuitiva que ambos se acercan cada vez más cuando los valores de los datos $x$ son cada vez más iguales, acercándose a la constante.