51 votos

Trillizos AM-GM-HM

Quiero entender qué valores se pueden alcanzar simultáneamente como las medias aritméticas (AM), geométricas (GM) y armónicas (HM) de secuencias finitas de números reales positivos. Precisamente, para qué puntos $(G, H) \in \mathbb R^2_{\geqslant 0}$ ¿existe un $n$ -tupla $a = (a_1, a_2, \ldots, a_n) \in \mathbb R^n_{\geqslant 0}$ tal que $$ \begin{align*} \operatorname{AM}(a) &= 1, \\ \operatorname{GM}(a) &= G, \\ \operatorname{HM}(a) &= H. \end{align*} $$ En este caso, la restricción de AM proporciona una normalización implícita en el $n$ -tupla. Nótese que la desigualdad AM-GM-HM implica que tal $(G, H)$ debe estar en la mitad inferior derecha del cuadrado unitario dado por

$$ \quad 1 \geqslant G \geqslant H \geqslant 0.\tag{$ \N - El brindis $}$$

Creo que el problema es bastante difícil para un general $n$ Así que me conformaré con $n = 4$ . De hecho, también me alegraré de ver cualquier límites que mejoran la $(\ast)$ ya sea para la generalidad de los $n$ o para determinados valores pequeños de $n$ . A continuación esbozo la solución para $n= 2$ y $n=3$ .


Caso $n=2$ . Resulta que, para cualquier par de números $(a_1, a_2)$ los tres medios satisfacen una relación estrecha: $\operatorname{AM} \cdot \operatorname{HM} = \operatorname{GM}^2$ . Es decir, todos nuestros puntos deben estar en la parábola $H = G^2$ .


Caso $n=3$ . Ahora desaparece la estrecha relación entre los medios; sin embargo, la situación sigue siendo lo suficientemente rígida como para permitir una solución algebraica. Es fácil comprobar que los tres números son raíces de la ecuación cúbica $$ x^3 - 3 \operatorname{AM} x^2 + 3 \frac{\operatorname{GM}^3}{\operatorname{HM}} x - \operatorname{GM}^3 = 0, $$ que se reordena a $$ H x^3 - 3H x^2 + 3 G^3 x - G^3 H = 0. $$ Queremos que esta ecuación tenga tres raíces reales y no negativas. Es bien sabido† que esto es equivalente a la condición de que el discriminante de la cúbica sea no negativo: $$ \begin{array}{crl} & 27 (6 G^6 H^3+3 G^6 H^2 -4 G^9 H-G^6 H^4-4 G^3 H^4) &\geqslant 0 \\ \iff & 6 G^3 H^2+3 G^3 H -4 G^6- G^3 H^3-4 H^3 &\geqslant 0. \end{array} $$

A continuación se muestra un gráfico de esta región para $n=3$ (con $G$ a lo largo del $x$ -eje y $H$ a lo largo del $y$ -eje):

AM-GM-HM plot for n=3


Pregunta. Para reafirmar mi pregunta:

¿Puede dar cualquier límites de la región AM-GM-HM para cualquier $n \geqslant 4$ que late $(\ast)$ ?

De hecho, la siguiente conjetura parece plausible:

Conjetura. Para cualquier $n$ existe $c = c_n > 0$ tal que lo siguiente es válido para cualquier $n$ -tupla de reales positivos: $$ \operatorname{AM} + c \operatorname{HM} \geqslant (1+c) \operatorname{GM}. $$ Es decir, la región se encuentra totalmente a la izquierda de la línea $G = \frac{1}{1+c} + \frac{c}{1+c} H$ .

Esta conjetura se inspira en un post anterior que esencialmente afirma que $c = \frac{33}{50}$ trabaja para $n=5$ .‡ La respuesta propuesta en ese hilo sugiere utilizar multiplicadores de Lagrange. Pero, por desgracia, me parece que es demasiado escasa en detalles; no estoy del todo seguro de lo fructífero que sería este enfoque. *


†Ver el Artículo de Wikipedia sobre la resolución de una ecuación cúbica .

‡La equivalencia entre el problema planteado y mi pregunta se explica claramente en La respuesta de Zarrax en ese hilo .

*La respuesta ya está borrada.

[Gracias a QED por la trama].

37voto

Anthony Shaw Puntos 858

Una forma de ver este problema es buscar los extremos de la media geométrica dadas las medias aritméticas y armónicas fijas.

Las siguientes desigualdades se pueden verificar tomando $\log$ s y el uso de Jensen: $$ \frac{1}{\int\frac{1}{x}\;\mathrm{d}\mu}\le\exp\left(\int\log(x)\;\mathrm{d}\mu\right)\le\int x\;\mathrm{d}\mu\tag{1} $$ Eso es, $HM\le GM\le AM$ .

Al escalar los datos se escalan las tres medias por el mismo factor, así que supongamos que $$ \int x\;\mathrm{d}\mu=1\quad\text{(arithmetic mean }=1\text{)}\tag{2} $$ y $$ \int\frac{\mathrm{d}\mu}{x}=\frac{1}{h}\quad\text{(harmonic mean }=h\text{)}\tag{3} $$ e intentar encontrar los valores críticos para el $\log$ de la media geométrica: $$ \int\log(x)\;\mathrm{d}\mu\tag{4} $$ Tomando las desviaciones de $(2)$ , $(3)$ y $(4)$ obtenemos que para todas las variaciones para que el $AM$ es estacionario $$ \int\delta x\;\mathrm{d}\mu=0\tag{5} $$ y el recíproco del $HM$ es estacionario, $$ \int\frac{\delta x}{x^2}\mathrm{d}\mu=0\tag{6} $$ también deberíamos tener que el $\log$ de la media geométrica es estacionaria: $$ \int\frac{\delta x}{x}\mathrm{d}\mu=0\tag{7} $$ Las consideraciones de linealidad dicen que $(5)$ , $(6)$ y $(7)$ implican que hay constantes $a$ y $b$ para que $$ \frac{1}{x}=a+\frac{b}{x^2}\tag{8} $$ Multiplicando $(8)$ por x y combinando con $(2)$ y $(3)$ rinde $$ 1=a+\frac{b}{h}\tag{9} $$ Resolver $(8)$ para $x$ y $(9)$ para $b$ obtenemos $$ x=\frac{1\pm\sqrt{1-4ha(1-a)}}{2a}\tag{10} $$ Para mantener $(2)$ necesitamos una combinación de los dos valores de $x$ : $$ \lambda\frac{1+\sqrt{1-4ha(1-a)}}{2a}+(1-\lambda)\frac{1-\sqrt{1-4ha(1-a)}}{2a}=1\tag{11} $$ Resolver $(11)$ para $\lambda$ obtenemos $$ \lambda=\frac{1}{2}\left(1+\frac{2a-1}{\sqrt{1-4ha(1-a)}}\right)\quad\text{and}\quad a=\frac{1}{2}\left(1+\frac{2\lambda-1}{\sqrt{1+4\frac{h}{1-h}\lambda(1-\lambda)}}\right)\tag{12} $$ Tenga en cuenta que $(12)$ muestra que $\lim\limits_{a\to0}\frac{\lambda}{a}=\lim\limits_{a\to1}\frac{1-\lambda}{1-a}=1$ .

Para una media armónica dada, $h$ y dividido entre los valores de $x$ , $\lambda$ , $(10)$ y $(12)$ se obtiene que la media geométrica estacionaria es $$ \begin{align} g(h,\lambda) &=\left(\frac{1+\sqrt{1-4ha(1-a)}}{2a}\right)^\lambda\left(\frac{1-\sqrt{1-4ha(1-a)}}{2a}\right)^{1-\lambda}\\ &=\frac{\left(\sqrt{1+4\frac{h}{1-h}\lambda(1-\lambda)}+1\right)^\lambda\left(\sqrt{1+4\frac{h}{1-h}\lambda(1-\lambda)}-1\right)^{1-\lambda}}{\sqrt{1+4\frac{h}{1-h}\lambda(1-\lambda)}+2\lambda-1}\tag{13} \end{align} $$ Para cada $h\in[0,1]$ , $g(h,\lambda)$ es monótona en $\lambda$ (verificado abajo) y $$ \lim_{\lambda\to0}g(h,\lambda)=h\qquad\text{and}\qquad\lim_{\lambda\to1}g(h,\lambda)=1\tag{14} $$ Con una selección continua de $\lambda$ podemos alcanzar cualquier valor de $g(h,\lambda)$ entre $h$ y $1$ . Sin embargo, cuando se trata de $n$ números, $\lambda$ sólo puede tomar los valores $\frac{1}{n}\dots \frac{n-1}{n}$ . Así, con una media armónica de $h$ la media geométrica sólo puede variar entre $g(h,\frac{1}{n})$ y $g(h,\frac{n-1}{n})$ .

$\mathbf{n}$ objetos con media aritmética $\mathbf{=1}$ :

range of geometric means


Demostración de que para cualquier $\mathbf{h}$ , $\mathbf{g(h,\lambda)}$ es monótona en $\mathbf{\lambda}$ :

Arreglar $h$ . Definir $$ \Delta=\sqrt{1+4\frac{h}{1-h}\lambda(1-\lambda)}\tag{15} $$ Utilizando $(13)$ y $(15)$ , obtenemos que $$ g(h,\lambda)=\frac{(\Delta+1)^\lambda(\Delta-1)^{1-\lambda}}{\Delta+2\lambda-1}\tag{16} $$ Ecuación $(15)$ también implica que $$ (1-h)\Delta^2+h(2\lambda-1)^2=1\tag{17} $$ En consideración a $(17)$ , defina $\eta$ y $\theta$ por $$ \begin{align} \sin(\eta)&=\sqrt{h}\\ \cos(\eta)&=\sqrt{1-h} \end{align}\tag{18} $$ y $$ \begin{align} \sin(\theta)&=\sin(\eta)\;(2\lambda-1)\\ \cos(\theta)&=\cos(\eta)\;\Delta \end{align}\tag{19} $$ donde $0\le\lambda\le1$ y por lo tanto $-\eta\le\theta\le\eta$ . Entonces, utilizando las identidades $$ \begin{array}{ccccc} \cos(\eta)(\Delta+1)&=&\cos(\theta)+\cos(\eta)&=&2\cos\left(\frac{\eta+\theta}{2}\right)\cos\left(\frac{\eta-\theta}{2}\right)\\ \cos(\eta)(\Delta-1)&=&\cos(\theta)-\cos(\eta)&=&2\sin\left(\frac{\eta+\theta}{2}\right)\sin\left(\frac{\eta-\theta}{2}\right)\\ \sin(\eta)2\lambda&=&\sin(\eta)+\sin(\theta)&=&2\sin\left(\frac{\eta+\theta}{2}\right)\cos\left(\frac{\eta-\theta}{2}\right)\\ \sin(\eta)2(1-\lambda)&=&\sin(\eta)-\sin(\theta)&=&2\cos\left(\frac{\eta+\theta}{2}\right)\sin\left(\frac{\eta-\theta}{2}\right) \end{array}\tag{20} $$ conseguimos que $$ \begin{align} &\left(\frac{1}{\sin(\eta)}\frac{(\Delta+1)^\lambda(\Delta-1)^{1-\lambda}}{\Delta+2\lambda-1}\right)^{2\sin(\eta)}\\ &\vphantom{\Huge{\dfrac{A}{A}}}=\frac{(\cos(\theta)+\cos(\eta))^{\sin(\eta)+\sin(\theta)}(\cos(\theta)-\cos(\eta))^{\sin(\eta)-\sin(\theta)}}{\left(\sin(\eta)\cos(\theta)+\cos(\eta)\sin(\theta)\right)^{2\sin(\eta)}}\\ &\vphantom{\Huge{\dfrac{A}{A}}}=\frac{(2\cos(\frac{\eta+\theta}{2})\cos(\frac{\eta-\theta}{2}))^{\sin(\eta)+\sin(\theta)}(2\sin(\frac{\eta+\theta}{2})\sin(\frac{\eta-\theta}{2}))^{\sin(\eta)-\sin(\theta)}}{\sin(\eta+\theta)^{2\sin(\eta)}}\\ &\vphantom{\Huge{\dfrac{A}{A}}}=\frac{(\sin(\eta+\theta)\sin(\eta-\theta))^{\sin(\eta)}(\cot(\frac{\eta+\theta}{2})\cot(\frac{\eta-\theta}{2}))^{\sin(\theta)}}{\sin(\eta+\theta)^{2\sin(\eta)}}\\ &\vphantom{\Huge{\dfrac{A}{A}}}=\left(\frac{\sin(\eta-\theta)}{\sin(\eta+\theta)}\right)^{\sin(\eta)}\left(\frac{\cos(\theta)+\cos(\eta)}{\cos(\theta)-\cos(\eta)}\right)^{\sin(\theta)}\tag{21} \end{align} $$ La derivada logarítmica de $(21)$ es $$ \begin{align} &\frac{\mathrm{d}}{\mathrm{d}\theta}\left(\sin(\eta)\log\left(\frac{\sin(\eta-\theta)}{\sin(\eta+\theta)}\right)+\sin(\theta)\log\left(\frac{\cos(\theta)+\cos(\eta)}{\cos(\theta)-\cos(\eta)}\right)\right)\\ &\vphantom{\Huge{A}}=\sin(\eta)(-\cot(\eta-\theta)-\cot(\eta+\theta))\\ &+\cos(\theta)\log\left(\frac{\cos(\theta)+\cos(\eta)}{\cos(\theta)-\cos(\eta)}\right)\\ &+\sin(\theta)\left(\frac{-\sin(\theta)}{\cos(\theta)+\cos(\eta)}+\frac{\sin(\theta)}{\cos(\theta)-\cos(\eta)}\right)\\ &\vphantom{\Huge{\dfrac{A}{A}}}=-2\cos(\eta)+\cos(\theta)\log\left(\frac{\cos(\theta)+\cos(\eta)}{\cos(\theta)-\cos(\eta)}\right)\tag{22} \end{align} $$ Dividiendo $(22)$ por $\cos(\theta)$ y el ajuste $t=\dfrac{\cos(\eta)}{\cos(\theta)}$ , se obtiene que $(22)$ desaparece precisamente cuando $$ -2t+\log\left(\frac{1+t}{1-t}\right)=0\tag{23} $$ Sin embargo, $(23)$ se desvanece sólo en $t=0$ sino porque $-\eta\le\theta\le\eta$ tenemos $t\ge\cos(\eta)=\sqrt{1-h}$ . Por lo tanto, $(22)$ no se desvanece, y por lo tanto, $(21)$ es monótona.

10voto

Lay González Puntos 135

Siento que estoy trayendo una maquinaria bastante pesada en este problema, pero ahí va.

La conjetura de Rahul Narain es correcta y se deduce del Teorema de la Variable Igual como se ha demostrado aquí

El teorema completo es mucho más general, pero para su pregunta basta con el caso 1 del Corolario 1.9:

Dejemos que $a_1, a_2, \ldots, a_n$ $(n \geq 3)$ sean números fijos no negativos, y que $0 \leq x_1 \leq x_2 \leq \cdots \leq x_n$ tal que $$ x_1+x_2+\cdots+x_n = a_1+a_2+\cdots+a_n,$$ $$x_1^p + x_2^p +\cdots+x_n^p = a_1^p + a_2^p +\cdots+ a_n^p,$$ y que $E = x_1^q + x_2^q +\cdots+x_n^q$ .

Caso 1. $p \leq 0$ ( $p=0$ rinde $x_1x_2\cdots x_n = a_1a_2\cdots a_n > 0$ ).

(a) Para $q \in (p,0) \cup (1, \infty)$ , $E$ es máxima cuando $0 \lt x_1 = x_2 = \cdots = x_{n-1} \leq x_n$ y es mínimo cuando $0 < x_1 \leq x_2 = x_3 = \cdots = x_n$ .

(b) Para $q \in (-\infty,p) \cup (0,1)$ , $E$ es mínimo cuando $0 \lt x_1 = x_2 = \cdots = x_{n-1} \leq x_n$ y es máxima cuando $0 < x_1 \leq x_2 = x_3 = \cdots = x_n$ .

Ahora toma $p=0$ para la media geométrica, $q = -1$ para la media armónica y utilizar la parte b) de arriba para llegar a la afirmación.

9voto

Chris Benard Puntos 1430

Bien, ahora tengo la prueba correcta. Cuando termine esta, borraré las otras. Estoy probando la intuición de Rahul, que el valor extremo del producto se produce cuando todos los $x_i$ pero uno son iguales. Más concretamente, demostraré que el producto se maximiza cuando el valor múltiple es mayor que el valor simple.

Lema: Dejemos que $a$ , $b$ y $c$ sean reales positivos; defina $n = a+b+c$ ; deja que $P$ y $Q$ sean reales positivos con $PQ > n^2$ . Entonces, en la curva $$\begin{matrix} P &=& ax+by+cz \\ Q &=& ax^{-1} + b y^{-1} + c z^{-1} \\ x,y,z &>& 0 , \end{matrix}$$ el valor máximo de $x^a y^b z^c$ se produce en un punto donde dos de $(x,y,z)$ son iguales y el tercero es más pequeño.

Observación: Si $PQ < n^2$ entonces las ecuaciones anteriores no tienen soluciones reales; si $PQ=n^2$ entonces la única solución real es $x=y=z=P/n$ . Así que el lema discute el caso interesante.

Prueba: En primer lugar, observe que las ecuaciones anteriores tienen todas sus soluciones dentro de la caja $[a/Q, P/a] \times [b/Q, P/b] \times [c/Q, P/q]$ y forman un subconjunto cerrado de esa caja. Por tanto, el espacio de soluciones es compacto (subconjunto cerrado de un conjunto acotado), y el máximo debe existir.

Dejemos que $(x,y,z)$ sea un punto en el que se satisfagan las dos ecuaciones. Si tuviéramos $x=y=z$ entonces $PQ=n^2$ por lo que no es posible que todos los $x$ , $y$ y $z$ son iguales.

El gradiente de la función $f:=ax+by+cz$ es $(a,b,c)$ . El gradiente de $g:=a x^{-1} + b y^{-1} + c z^{-1}$ es $(-a x^{-2}, -b y^{-2}, -c z^{-2})$ . Desde $x$ , $y$ y $z$ no son todos iguales, estos vectores no son paralelos. Así, las dos superficies $f=P$ y $g=Q$ se encuentran transversalmente, en una curva suave. Un vector tangente a esa curva es $$(a,b,c) \times (-a x^{-2}, -b y^{-2}, -c z^{-2}) = {\LARGE (} bc (y^{-2} - z^{-2}), ac (z^{-2} - x^{-2}), ab(x^{-2} - y^{-2}) {\LARGE )} \quad (\ast)$$

En lugar de optimizar $x^a y^b z^c$ optimizaremos $h:= \log(x^a y^b z^c) = a \log x + b \log y + c \log z$ . La derivada de $h$ a lo largo del vector $(\ast)$ es $$abc (x^{-1} y^{-2} - x^{-1} z^{-2} + y^{-1} z^{-2} - y^{-1} x^{-2} + z^{-1} x^{-2} - z^{-1} y^{-2} ) = \frac{abc}{x^2 y^2 z^2} (x-y)(x-z)(y-z). \quad (\ast\ast).$$

Si $x$ , $y$ y $z$ son todos distintos, entonces $(\ast \ast)$ es distinto de cero, por lo que moviéndose a lo largo de la curva $f=P$ , $g=Q$ en una u otra dirección causará $h$ aumentar. Un análisis más detallado (omitido) muestra que tenemos un máximo local cuando el mayor número de $(x,y,z)$ ocurre dos veces. $\square$

Ahora demostramos el resultado. Sea $(x_1, \ldots, x_n)$ sea cualquier $n$ -de reales positivos. Demostraremos que hay $y$ y $z$ con $y+(n-1) z = \sum x_i$ , $y^{-1} + (n-1) z^{-1} = \sum x_i^{-1}$ , $y<z$ y $y z^{n-1} \geq \prod x_i$ . En otras palabras, $(y,z,z,z,\ldots, z)$ maximiza $\prod x_i$ sujeta a valores fijos de $\sum x_i$ y $\sum x_i^{-1}$ .

La prueba procede en $n-2$ pasos. En cada paso, aumentamos el número de veces que aparece el valor máximo entre $(x_1, x_2, \ldots, x_n)$ y aumentar $\prod x_i$ Todo ello mientras se mantiene $\sum x_i$ y $\sum x_i^{-1}$ constante. Entonces, supongamos que $x_1=x_2=\cdots = x_k > x_{k+1}, \ldots, x_n$ para algunos $k$ . Si $k=n-1$ entonces hemos terminado. Si no, mantenga $x_{k+3}$ a través de $x_n$ arreglado, mientras que la sustitución de $(x_1, \ldots, x_{k+2})$ por los valores que maximizan $\prod_{i=1}^{k+2} x_i$ mientras sostiene $\sum_{i=1}^{k+2} x_i$ y $\sum_{i=1}^{k+2} x_i^{-1}$ fijo. Por el Lemma, el nuevo valor máximo se producirá ahora $k+1$ veces. Después de un número finito de pasos de este tipo, el valor máximo se produce $n-1$ veces y hemos llegado al máximo.


Si quieres una fórmula explícita para el valor máximo de la media geométrica, entonces tienes que resolver realmente las ecuaciones $$\begin{matrix} y+(n-1) z &=& P \\ y^{-1} + (n-1) ^{-1} &=& Q \end{matrix}$$ Esto no es tan malo: Despejando los denominadores en la segunda ecuación y sustituyendo en la primera se obtiene $z+(n-1) (P - (n-1) z) = Q z(P-(n-1) z)$ . Se trata de una cuadrática en $z$ Así que es explícitamente solucionable, pero debo decir que no encuentro la solución esclarecedora. De todos modos, tomemos esa solución y calculemos $y^{1/n} z^{(n-1)/n}$ y habrá calculado el valor óptimo de la media geométrica cuando la media aritmética sea $P/n$ y el armónico es $n/Q$ .

2voto

Chris Benard Puntos 1430

El otro día estuve revisando respuestas antiguas y me di cuenta de que nunca resolvimos la pregunta original. Demostramos que, dados los valores para el AM y el HM, el valor máximo del GM se produce cuando tomamos todos los $x_i$ para ser igual, y el otro para ser menos. En otras palabras, miramos $x^{(n-1)/n} y^{1/n}$ donde $x$ y $y$ son las raíces de $$(1/n) x + (n-1)/n y = AM \quad 1/n x^{-1} + (n-1)/n y^{-1} = HM^{-1}$$ con $x>y$ .

Pero nunca hemos averiguado si existe un límite no trivial de la forma $GM \leq \theta AM + (1-\theta) HM$ .

El objetivo de esta respuesta es señalar que existe un límite no trivial. Pero va a ser muy difícil de encontrar explícitamente.

Siguiendo la excelente sugerencia de robjohn, toma $\lambda=1/n$ . De forma más general, observamos las ecuaciones $$AM= \lambda x + (1-\lambda) y \quad GM = x^{\lambda} y^{1-\lambda} \quad HM = (\lambda x^{-1} + (1-\lambda) y^{-1})^{-1}.$$ Para cualquier valor particular de $(AM, GM, HM)$ el valor óptimo de $\theta$ es $\frac{GM-HM}{AM-HM}$ . Me pareció más conveniente normalizar $GM=1$ Así que $(x,y)$ son de la forma $(e^{-(1-\lambda) t}, e^{\lambda t})$ . Lo que queremos demostrar es que, para cualquier $\lambda$ , $$\sup_{t} \frac{GM-HM}{AM-HM} < 1.$$

Buenas noticias: La afirmación es verdadera. Esquema de la prueba: Para $t \neq 0$ , set $$f(\lambda, t) = \frac{GM-HM}{AM-HM} = \frac{1-(\lambda e^{(1-\lambda) t} + (1-\lambda) e^{- \lambda t})^{-1}}{(\lambda e^{-(1-\lambda) t} + (1-\lambda) e^{ \lambda t})- (\lambda e^{(1-\lambda) t} + (1-\lambda) e^{- \lambda t})^{-1}}.$$ Un cálculo cuidadoso muestra que $\lim_{t \to 0} f(\lambda, t) = 1/2$ por lo que definir $f(\lambda, 0)=1/2$ da una función continua de $t$ . Además, $f$ va a $0$ como $t \to \pm \infty$ . Así que el máximo de $f(\lambda, t)$ se obtiene en algún $t_0$ . Si $t_0$ fuera cero, entonces el máximo sería $1/2$ . Si $t_0$ fueran distintos de cero, entonces $AM>GM$ Así que $\frac{GM-HM}{AM-HM} < 1$ . De cualquier manera, el máximo es menos de $1$ . $\square$ .

Malas noticias: Aquí hay un gráfico de $f(1/3, t)$ .

enter image description here

Como puede ver, el máximo no se produce en $t=0$ . Así que tenemos que averiguar dónde se produce este máximo para tener una oportunidad.

1voto

Tom Puntos 136

$\newcommand{\tr}{\operatorname{Tr}}$

Acabo de encontrarme con este divertido problema. Espero que no sea demasiado tarde para aportar algo. Pensé en añadir algunas observaciones que no resuelven directamente la conjetura original, pero que, sin embargo, limitan explícitamente la media geométrica por una función (no trivial) de las medias aritmética y armónica.

Mi argumento es una teoría de la información; invoca algunos resultados profundos, pero un subproducto es que la cuestión de relacionar las desigualdades AM-GM y GM-HM puede verse en un contexto mucho más general. Para ver lo que quiero decir con esto, dejemos que $\gamma_s$ denotan la medida de probabilidad gaussiana centrada en $\mathbb{R}^n$ con matriz de covarianza $sI$ y que $\mu$ denotan cualquier otra medida de probabilidad centrada. Las desigualdades de Sobolev logarítmico de Gross (LSI) y de Talagrand son, respectivamente \begin{align} s I(\mu | \gamma_s) \geq 2 H(\mu | \gamma_s) \geq \frac{1}{s}W(\mu,\gamma_s)^2, ~(1) \end{align} donde $I$ denota la información relativa de Fisher, $H$ denota la entropía relativa, y $W$ es la distancia cuadrática de Wasserstein. Si consideramos $\mu$ para ser la medida de probabilidad gaussiana centrada con matriz de covarianza $\Sigma$ entonces el LSI se reduce (después del álgebra) a: \begin{align} s \frac{\tr(\Sigma^{-1})}{n} - \log s -1 \geq \frac{1}{n}\log \det(\Sigma^{-1}) ~~~\forall s>0.\notag \end{align} Minimizar el LHS sobre $s>0$ da la desigualdad $\frac{1}{n}\tr(\Sigma^{-1}) \geq (\det (\Sigma^{-1}))^{1/n}$ que es precisamente la desigualdad AM-GM aplicada a los valores propios de $\Sigma^{-1}$ que denotaremos en adelante por $\lambda_1, \lambda_2, \dots, \lambda_n$ .

A continuación, la desigualdad de Talagrand (después del álgebra) se reduce a \begin{align} \frac{1}{n}\log \det(\Sigma^{-1}) \geq - 2\left(\frac{1}{\sqrt{s}} \frac{\tr(\Sigma^{1/2})}{n} - \log\frac{1}{\sqrt{s}} - 1 \right)~~~\forall s>0.\notag \end{align} Maximizar el RHS sobre $s>0$ da la desigualdad $(\det (\Sigma^{-1}))^{1/n}\geq \left( \frac{n}{\tr(\Sigma^{1/2})}\right)^2$ . Esta última cantidad es la media armónica al cuadrado de $\lambda^{1/2}_1, \lambda^{1/2}_2, \dots, \lambda^{1/2}_n$ que es mayor que la media armónica de $\lambda_1, \lambda_2, \dots, \lambda_n$ por la desigualdad de Jensen.

Por lo tanto, cuando se aplica a una medida gaussiana $\mu$ las desigualdades (1) recogen el contenido de las desigualdades AM-GM y GM-HM, respectivamente.

Ahora bien, se sabe que las desigualdades LSI y Talagrand no existen de forma aislada. Son famosas por estar relacionadas por la llamada desigualdad HWI, que en el presente escenario es como sigue: \begin{align} H(\mu | \gamma_s) \leq W(\mu, \gamma_s)\sqrt{I(\mu | \gamma_s)} - \frac{1}{2s}W(\mu,\gamma_s)^2.\notag \end{align} Por la fórmula cuadrática, debemos tener \begin{align} \sqrt{s I(\mu | \gamma_s)-2 H(\mu | \gamma_s)} \geq \sqrt{sI(\mu | \gamma_s) } - \frac{1}{\sqrt{s}}W(\mu,\gamma_s).\notag \end{align} Para simplificar la notación, escribo $A$ , $G$ y $H$ para denotar el AM, GM y HM de $\lambda_1, \lambda_2, \dots, \lambda_n$ . Además, dejemos que $H_{1/2}$ denotan el HM de $\sqrt{\lambda_1}, \sqrt{\lambda_2}, \dots, \sqrt{\lambda_n}$ . Entonces, particularizando la desigualdad general anterior a nuestro entorno se obtiene

\begin{align} \left( s A - \log s -1 - \log G \right)^{1/2} \geq \left(\frac{1}{sH} -2 + s A \right)^{1/2} - \left( \frac{1}{sH} +1-\frac{2}{\sqrt{s H^2_{1/2}}} \right)^{1/2} ~~~\forall s>0. \label{HGA} \end{align}
Tenga en cuenta que, para cada $s>0$ esto da un interesante límite superior (sin dimensión) en $G$ en términos de $A, H$ y $H_{1/2}$ . Esto parece proporcionar una respuesta que responde al espíritu básico de la conjetura.

Aclaración: supongo que la desigualdad final podría demostrarse directamente, ahora que se conoce la forma. Sin embargo, no he intentado hacerlo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X