Podemos incluso generalizar esta idea más allá: consideremos la definición de una media de potencia: $$\mu_p=\left(\frac{1}{n} \sum_{i=1}^n x_i^p \right)^\frac{1}{p}$$ Obtenemos la media aritmética cuando conectamos $p=1$ y la media geométrica cuando $p\rightarrow0$ . Resulta que cuanto menor sea el valor de $p$ menos impacto tienen los números grandes y más impacto tienen los números pequeños. Observe que, por ejemplo, aunque $x_1$ es muy cercano a cero la media aritmética siempre será al menos $\frac{x_2+x_3+\dots+x_n}{n}$ para que no baje a cero. No es el caso del otro extremo: la media aritmética puede ser arbitrariamente grande sólo por un único elemento. Lo mismo ocurre con todas las medias de potencia con $p>0$ . Para los negativos $p$ tenemos el comportamiento inverso. Consideremos una media armónica (que es un recíproco de una media aritmética de recíprocos y también una media de potencias con $p=-1$ ): $$\frac{n}{\sum_{i=1}^{n}\frac{1}{x_i}}$$ Vemos que incluso si $x_1$ es enorme, su recíproco seguirá siendo mayor que cero haciendo que la media total sea menor que: $$\frac{n}{\sum_{i=2}^{n}\frac{1}{x_i}}$$ Pero si sólo un elemento está muy cerca de cero, su recíproco será muy grande, lo que hará que todo el denominador sea grande y, por tanto, que la media armónica baje a cero. La media geométrica, al ser una media de potencias con $p=0$ exhibe estos dos comportamientos: puede hacerse grande o pequeño bajo la influencia de un solo elemento. Al principio parece malo, pero hay que recordar que será menos sensible a los valores atípicos grandes que cualquier media de potencia con $p>0$ (como por ejemplo la media aritmética) y menos sensible a los pequeños valores atípicos que cualquier media de potencia con $p<0$ (como la media armónica), por lo que en cierto sentido puede ser un buen compromiso.
También hay dos casos especiales/limítrofes importantes de la media de potencia, principalmente $p \rightarrow \infty$ y $p \rightarrow -\infty$ . En el primer caso, sólo obtenemos el máximo y en el segundo el mínimo de los datos. Obviamente, al tratarse de extremos, el máximo es completamente sensible a los grandes valores atípicos y completamente insensible a los pequeños, mientras que el mínimo presenta un comportamiento opuesto. Evidentemente, son un ejemplo horrible de "media", pero pueden servir de ayuda para entender el comportamiento general.
He generado una muestra aleatoria de millones de números distribuidos uniformemente y he calculado sus medias de potencia para diferentes valores de $p$ . Para $p=1$ observamos la media de alrededor de $\frac{1}{2}$ que es una verdadera media de la distribución. Para valores mayores de $p$ obtenemos mayores medios, como siempre, pero como pueden ver por $p<1$ observamos valores muy pequeños de la media. También para los más grandes $p$ la media parece no ser representativa. Así que hay que elegir en función de la distribución.
PRUEBA DE QUE LA MEDIA GEOMÉTRICA ES UNA MEDIA DE POTENCIA PARA $p=0$ :
Tenemos gracias a la regla de L'Hôpital: $$\log u_0=\lim_{p\rightarrow 0}\frac{\log(\sum_{i=1}^n x_i^p)-\log(n)}{p}=\lim_{p\rightarrow 0}\frac{\sum_{i=1}^n x_i^p \log x_i}{\sum_{i=1}^n x_i^p}=\frac{1}{n}\sum_{i=1}^n \log x_i$$ Así que, efectivamente: $$\mu_0=\exp\left(\frac{1}{n}\sum_{i=1}^n \log x_i \right)=\left(\prod_{i=1}^nx_i \right)^\frac{1}{n}$$
5 votos
"A diferencia del AM, el GM se mide en escala logarítmica y por esa razón se cree generalmente que el GM no es tan sensible a las observaciones extremas o a los valores atípicos", La mediana geométrica y su aplicación en la identificación de múltiples valores atípicos .
1 votos
Este motiva $\sigma_{\ln X}\approx\frac{\sigma_X}{X}$ .