El artículo al que hace referencia Chl ofrece información importante, ya que muestra que no se trata de una regla general (ni siquiera para variables continuas, suaves y de "buen comportamiento", como la de Weibull). Así que, aunque a menudo puede ser aproximadamente cierta, con frecuencia no lo es.
Entonces, ¿de dónde viene Pearson? ¿Cómo ha llegado a esta aproximación?
Afortunadamente, Pearson nos dice más o menos la respuesta.
El primer uso del término "skew" en el sentido que lo estamos utilizando parece ser el de Pearson, 1895 [1] (aparece justo en el título). También parece que es en este trabajo donde introduce el término modo (nota a pie de página, p345):
Me ha parecido conveniente utilizar el término modo para la abscisa correspondiente a la ordenada de la frecuencia máxima. La "media", la "moda" y la "mediana" tienen caracteres distintos importantes para el estadístico.
También parece ser su primer detalle real de su sistema de curvas de frecuencia .
Así que al discutir la estimación del parámetro de forma en el Pearson Tipo III (lo que ahora llamaríamos una gamma desplazada -y posiblemente invertida-), dice (p375):
La media, la mediana y la moda o coordenada máxima están marcadas por bb , cc y aa respectivamente, y en cuanto se dibujaron las curvas, se manifestó una notable relación entre la posición de las tres cantidades: la mediana, mientras $p$ fue positiva* se observó un tercio de la media hacia el máximo $^\dagger$
* esto corresponde a la gamma que tiene parámetro de forma $>1$
$\dagger$ aquí la intención de "máximo" es la $x$ -valor de la frecuencia máxima (la moda), como queda claro al principio de la cita, no el máximo de la variable aleatoria.
Y de hecho, si observamos la relación entre (media-modo) y (media-mediana) para la distribución gamma, observamos esto:
(La parte azul marca la región en la que Pearson dice que la aproximación es razonable).
De hecho, si observamos algunas otras distribuciones del sistema de Pearson -por ejemplo, las distribuciones beta-, la misma relación se mantiene aproximadamente mientras $\alpha$ y $\beta$ no son demasiado pequeños:
(la elección particular de las subfamilias de la beta con $\sqrt{\beta}-\sqrt{\alpha}=k$ fue tomada debido a la aparición de $\sqrt{\beta}-\sqrt{\alpha}$ en la asimetría del momento, de tal manera que el aumento de $\alpha$ para la constante $\sqrt{\beta}-\sqrt{\alpha}$ corresponde a una asimetría de momento decreciente. Curiosamente, para los valores de $\alpha$ y $\beta$ tal que $\sqrt{\beta}+\sqrt{\alpha}=c$ las curvas tienen (media-modo)/(media-mediana) casi constantes, lo que sugiere que podríamos decir que la aproximación es razonable si $\sqrt{\beta}+\sqrt{\alpha}$ es lo suficientemente grande, aunque posiblemente con algún mínimo en el menor de $\alpha$ y $\beta$ .)
La gamma inversa también está en el sistema de Pearson; también tiene la relación para valores grandes del parámetro de forma (digamos aproximadamente $\alpha>10$ ):
Es de esperar que Pearson también estuviera familiarizado con la distribución lognormal. En ese caso, la moda, la mediana y la media son respectivamente $e^{\mu-\sigma^2}, e^{\mu}$ y $e^{\mu+\sigma^2/2}$ se discutió antes del desarrollo de su sistema y se asocia a menudo con Galton.
Volvamos a examinar (media-modo)/(media-mediana). Anulando un factor de $e^{\mu}$ del numerador y del denominador, nos queda $\frac{e^{\sigma^2/2}-e^{-\sigma^2}}{e^{\sigma^2/2}-1}$ . A primer orden (que será preciso cuando $\sigma^2$ es pequeño), el numerador será $\frac{3}{2}\sigma^2$ y el denominador $\frac{1}{2}\sigma^2$ Así que, al menos para los pequeños $\sigma^2$ también debería valer para la lognormal.
Hay un buen número de distribuciones bien conocidas -con varias de las cuales Pearson estaba familiarizado- para las que se aproxima a la verdad para un amplio rango de valores de los parámetros; se dio cuenta de ello con la distribución gamma, pero habría tenido la idea confirmada cuando llegó a mirar otras varias distribuciones que probablemente consideraría.
[1]: Pearson, K. (1895),
"Contribuciones a la teoría matemática de la evolución, II: Variación de la inclinación en material homogéneo".
Philosophical Transactions of the Royal Society, Serie A, 186, 343-414
[Fuera de los derechos de autor. Disponible gratuitamente aquí ]