Primero puede haber colas izquierdas y colas derechas, luego colas largas y colas cortas. Se puede pensar en una distribución de cola corta como teniendo un rango finito, llamado soporte. Y una cola larga tiene un soporte semi-infinito en esa dirección. Para la pesadez de la cola derecha, se hace una comparación de funciones de supervivencia (RVs) o funciones de densidad cumulativa complementarias (1-CDF), típicamente examinando el logaritmo de la razón de dos distribuciones diferentes. En general, de cola pesada significa más pesado que la distribución exponencial, y de cola ligera significa más ligero que eso. Un subconjunto de distribuciones de colas más pesadas se llama "colas gordas". Desde una perspectiva histórica es muy probable que el concepto de cola gorda se relacione con el tipo I de distribución de Pareto, es decir, \begin{equation}\label{eq:PD} \text{PD}(t; \alpha, \beta)= \dfrac{\alpha}{t} \left(\dfrac{\beta}{t}\right) ^{\alpha } \theta(t-\beta)\;, \end{equation}
donde $\alpha$ es el parámetro de forma, $\beta$ es un parámetro de escala y $\theta(\cdot)$ es la función de paso unitario tal que $\theta(t-\beta)$ es la función de paso unitario retrasada en el tiempo por $\beta$, y se usa para hacer un producto que no es cero solo cuando $t> \beta$.
Desde Juran, "El Principio de Pareto (Sic, regla 80-20) recibe su nombre del economista nacido en Italia Vilfredo Pareto (1848-1923), quien observó que relativamente pocas personas tenían la mayoría de la riqueza (20%) - allá por 1895. Pareto desarrolló modelos matemáticos logarítmicos para describir esta distribución no uniforme de la riqueza y el matemático M.O. Lorenz desarrolló gráficos para ilustrarla."
A continuación, consideremos la actitud hacia la riqueza en ese momento. Renzaho cita a Grivetti diciendo "A principios del siglo XX en América del Norte la obesidad era admirada; los consumidores de clase alta exhibían su riqueza alrededor de la cintura. Mejillas gordas y estómagos amplios eran señales visuales de que los individuos estaban saludables, no infectados con el temido cuerpo tuberculosis. Las fotografías de ejecutivos americanos tomadas a finales del siglo XIX y principios del XX revelan que la ingesta dietética de los caballeros adinerados regularmente excedía las calorías gastadas."
La historia de esos tiempos otorga considerable peso a esas palabras. Según el censo de Estados Unidos de 1910, la tuberculosis, A.K.A., "consumption", que literalmente consume el cuerpo desde el interior, había sido endémica durante décadas y era responsable de aproximadamente 15 muertes por cada 1,000 habitantes por año, o, si lo desea, aproximadamente 30 veces la tasa de mortalidad anual por SARS-CoV-2. Por lo tanto, la idea más moderna de que la delgadez es saludable no era plausible en esa época.
A continuación, el término "fat cats" comenzó a describir a los donantes políticos adinerados alrededor de 1920 o antes y el trabajo de Pareto fue traducido por primera vez al inglés en 1916. Wesolowski et al. resumen las actitudes predominantes de esos tiempos en una nota al pie, "Irónicamente, la distribución de riqueza de cola gorda inspiró las políticas económicas de Karl Marx [49], así como las de Benito Mussolini como reacciones extremas diametralmente opuestas a las mismas estadísticas [50]." y atribuyen el significado de colas gordas de la siguiente manera, "La forma estadística de una ley de potencias es la distribución de Pareto (PD), que al igual que la distribución de Cauchy, tiene colas tan pesadas que confieren propiedades estadísticas inusuales y han recibido el nombre de distribuciones de colas gordas. Las leyes de potencias son independientes de la escala y intrínsecamente fractales."
En ese trabajo, [49] se refiere a Of Fat Cats and Fat Tails: From the Financial Crisis to the 'New' Probabilistic Marxism y [50] se refiere a Pareto and Fascism Reconsidered by Zanden. Que Vilfredo Pareto tuviera a Benito Mussolini como su estudiante más conocido no debería pasar desapercibido.
1 votos
Gran pregunta. Hay una gran cantidad de otros descriptores de colas que parecen ser algo intercambiables a primera vista. En particular, de cola larga (que a veces se utiliza indistintamente con cola pesada y derecha), si tomas la primera oración del artículo de Wikipedia al pie de la letra, parece ser un superconjunto de colas pesadas y difíciles (como se definen más rígidamente en sus propias páginas).
1 votos
Me encontré con una distribución con valores atípicos (cambio semanal % del S&P 500) y me interesé en este tema. Hay casos en los que la integral de la MGF no converge, pero todos los momentos existen. Para los datos de acciones, parece que se ajusta una distribución t con 3 grados de libertad (excepto por la asimetría).