47 votos

Relación empírica entre la media, la mediana y la moda

Para una distribución unimodal moderadamente sesgada, tenemos la siguiente relación empírica entre la media, la mediana y la moda: $$ \text{(Mean - Mode)}\sim 3\,\text{(Mean - Median)} $$ ¿Cómo se ha derivado esta relación?

¿Karl Pearson trazó miles de estas relaciones antes de formarse esta conclusión, o hay una línea lógica de razonamiento detrás de esta relación?

34voto

Patrick Puntos 183

Denote $\mu$ la media ( $\neq$ media), $m$ la mediana, $\sigma$ la desviación estándar y $M$ el modo. Por último, dejemos que $X$ sea la muestra, una realización de una distribución continua unimodal $F$ para los que existen los dos primeros momentos.

Es bien sabido que

$$|\mu-m|\leq\sigma\label{d}\tag{1}$$

Este es un ejercicio frecuente en los libros de texto:

\begin{eqnarray} |\mu-m| &=& |E(X-m)| \\ &\leq& E|X-m| \\ &\leq& E|X-\mu| \\ &=& E\sqrt{(X-\mu)^2} \\ &\leq& \sqrt{E(X-\mu)^2} \\ &=& \sigma \end{eqnarray} La primera igualdad se deriva de la definición de la media, la tercera se produce porque la mediana es el único minimizador (entre todos los $c$ ') de $E|X-c|$ y la cuarta de la desigualdad de Jensen (es decir, la definición de función convexa). En realidad, esta desigualdad puede hacerse más estricta. De hecho, para cualquier $F$ satisfaciendo las condiciones anteriores, se puede demostrar [3] que

$$|m-\mu|\leq \sqrt{0.6}\sigma\label{f}\tag{2}$$

Aunque en general no es cierto ( Abadir, 2005 ) que cualquier distribución unimodal debe satisfacer una de las dos cosas siguientes $$M\leq m\leq\mu\textit{ or }M\geq m\geq \mu$$ todavía se puede demostrar que la desigualdad

$$|\mu-M|\leq\sqrt{3}\sigma\label{e}\tag{3}$$

es válida para cualquier distribución unimodal y cuadrada integrable (independientemente de la inclinación). Esto se demuestra formalmente en Johnson y Rogers (1951) aunque la prueba depende de muchos lemas auxiliares que son difíciles de encajar aquí. Ve a ver el artículo original.


Una condición suficiente para una distribución $F$ para satisfacer $\mu\leq m\leq M$ se da en [2]. Si $F$ :

$$F(mx)+F(m+x)\geq 1 \text{ for all }x\label{g}\tag{4}$$

entonces $\mu\leq m\leq M$ . Además, si $\mu\neq m$ entonces la desigualdad es estricta. Las distribuciones de Pearson tipo I a XII son un ejemplo de familia de distribuciones que satisfacen $(4)$ [4] (por ejemplo, la Weibull es una distribución común para la que $(4)$ no se cumple, véase [5]).

Suponiendo ahora que $(4)$ se cumple estrictamente y con el fin de que $\sigma=1$ tenemos que $$3(m-\mu)\in(0,3\sqrt{0.6}] \mbox{ and } M-\mu\in(m-\mu,\sqrt{3}]$$

y como el segundo de estos dos rangos no está vacío, es ciertamente posible encontrar distribuciones para las que la afirmación es verdadera (por ejemplo, cuando $0<m-\mu<\frac{\sqrt{3}}{3}<\sigma=1$ ) para cierto rango de valores de los parámetros de la distribución, pero no es cierto para todas las distribuciones y ni siquiera para todas las distribuciones que satisfacen $(4)$ .

  • [0]: El problema del momento para distribuciones unimodales. N. L. Johnson y C. A. Rogers. The Annals of Mathematical Statistics, Vol. 22, No. 3 (Sep., 1951), pp. 433-439
  • [1]: La desigualdad media-media-modo: Contraejemplos Karim M. Abadir Econometric Theory, Vol. 21, No. 2 (abr., 2005), pp. 477-482
  • [2]: W. R. van Zwet, Media, mediana, moda II, Statist. Neerlandica, 33 (1979), pp. 1--5.
  • [3]: The Mean, Median, and Mode of Unimodal Distributions:A Characterization. S. Basu y A. DasGupta (1997). Theory Probab. Appl., 41(2), 210-223.
  • [4]: Algunas observaciones sobre la media, la mediana, la moda y la asimetría. Michikazu Sato. Australian Journal of Statistics. Volumen 39, número 2, páginas 219-224, junio de 1997
  • [5]: P. T. von Hippel (2005). Media, mediana y sesgo: Corrección de una regla de libro de texto. Journal of Statistics Education Volumen 13, Número 2.

0 votos

Lo siento, sólo soy un estudiante de matemáticas de primer año. ¿Podría proporcionar/recomendar un enlace/libro/documento que describa cómo se derivó la relación?

3 votos

@Sara creo que se remonta a Karl Pearson, que utiliza esta relación empírica para su "asimetría del modo Pearson". Aparte de esto, puede ser interesante este artículo online, j.mp/aWymCv .

0 votos

Gracias chl y kwak por el enlace y la respuesta que habéis dado. Las estudiaré.

9voto

AdamSane Puntos 1825

El artículo al que hace referencia Chl ofrece información importante, ya que muestra que no se trata de una regla general (ni siquiera para variables continuas, suaves y de "buen comportamiento", como la de Weibull). Así que, aunque a menudo puede ser aproximadamente cierta, con frecuencia no lo es.

Entonces, ¿de dónde viene Pearson? ¿Cómo ha llegado a esta aproximación?

Afortunadamente, Pearson nos dice más o menos la respuesta.

El primer uso del término "skew" en el sentido que lo estamos utilizando parece ser el de Pearson, 1895 [1] (aparece justo en el título). También parece que es en este trabajo donde introduce el término modo (nota a pie de página, p345):

Me ha parecido conveniente utilizar el término modo para la abscisa correspondiente a la ordenada de la frecuencia máxima. La "media", la "moda" y la "mediana" tienen caracteres distintos importantes para el estadístico.

También parece ser su primer detalle real de su sistema de curvas de frecuencia .

Así que al discutir la estimación del parámetro de forma en el Pearson Tipo III (lo que ahora llamaríamos una gamma desplazada -y posiblemente invertida-), dice (p375):

La media, la mediana y la moda o coordenada máxima están marcadas por bb , cc y aa respectivamente, y en cuanto se dibujaron las curvas, se manifestó una notable relación entre la posición de las tres cantidades: la mediana, mientras $p$ fue positiva* se observó un tercio de la media hacia el máximo $^\dagger$

* esto corresponde a la gamma que tiene parámetro de forma $>1$

$\dagger$ aquí la intención de "máximo" es la $x$ -valor de la frecuencia máxima (la moda), como queda claro al principio de la cita, no el máximo de la variable aleatoria.

Y de hecho, si observamos la relación entre (media-modo) y (media-mediana) para la distribución gamma, observamos esto:

enter image description here

(La parte azul marca la región en la que Pearson dice que la aproximación es razonable).

De hecho, si observamos algunas otras distribuciones del sistema de Pearson -por ejemplo, las distribuciones beta-, la misma relación se mantiene aproximadamente mientras $\alpha$ y $\beta$ no son demasiado pequeños:

enter image description here

(la elección particular de las subfamilias de la beta con $\sqrt{\beta}-\sqrt{\alpha}=k$ fue tomada debido a la aparición de $\sqrt{\beta}-\sqrt{\alpha}$ en la asimetría del momento, de tal manera que el aumento de $\alpha$ para la constante $\sqrt{\beta}-\sqrt{\alpha}$ corresponde a una asimetría de momento decreciente. Curiosamente, para los valores de $\alpha$ y $\beta$ tal que $\sqrt{\beta}+\sqrt{\alpha}=c$ las curvas tienen (media-modo)/(media-mediana) casi constantes, lo que sugiere que podríamos decir que la aproximación es razonable si $\sqrt{\beta}+\sqrt{\alpha}$ es lo suficientemente grande, aunque posiblemente con algún mínimo en el menor de $\alpha$ y $\beta$ .)

La gamma inversa también está en el sistema de Pearson; también tiene la relación para valores grandes del parámetro de forma (digamos aproximadamente $\alpha>10$ ):

enter image description here

Es de esperar que Pearson también estuviera familiarizado con la distribución lognormal. En ese caso, la moda, la mediana y la media son respectivamente $e^{\mu-\sigma^2}, e^{\mu}$ y $e^{\mu+\sigma^2/2}$ se discutió antes del desarrollo de su sistema y se asocia a menudo con Galton.

Volvamos a examinar (media-modo)/(media-mediana). Anulando un factor de $e^{\mu}$ del numerador y del denominador, nos queda $\frac{e^{\sigma^2/2}-e^{-\sigma^2}}{e^{\sigma^2/2}-1}$ . A primer orden (que será preciso cuando $\sigma^2$ es pequeño), el numerador será $\frac{3}{2}\sigma^2$ y el denominador $\frac{1}{2}\sigma^2$ Así que, al menos para los pequeños $\sigma^2$ también debería valer para la lognormal.

Hay un buen número de distribuciones bien conocidas -con varias de las cuales Pearson estaba familiarizado- para las que se aproxima a la verdad para un amplio rango de valores de los parámetros; se dio cuenta de ello con la distribución gamma, pero habría tenido la idea confirmada cuando llegó a mirar otras varias distribuciones que probablemente consideraría.

[1]: Pearson, K. (1895),
"Contribuciones a la teoría matemática de la evolución, II: Variación de la inclinación en material homogéneo".
Philosophical Transactions of the Royal Society, Serie A, 186, 343-414
[Fuera de los derechos de autor. Disponible gratuitamente aquí ]

6voto

Aksakal Puntos 11351

Esta relación no fue derivada. Se observó que se mantiene aproximadamente en distribuciones casi simétricas empíricamente . Véase la exposición de Yule en Introducción a la teoría de la estadística (1922), p. 121, capítulo VII, sección 20. Presenta el ejemplo empírico.

1 votos

+1 De hecho, mi cita de Pearson 1895 indica que es algo que él notó más que derivado.

2 votos

Los textos matemáticos antiguos son mucho más divertidos de leer que los actuales

1 votos

No es que realmente importe, pero cuando investigué un poco sobre el libro (porque quiero citarlo) encontré que la relación ya estaba señalada en el primera edición del libro publicado en 1911.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X