3 votos

$P(\lvert X - \mu\rvert \geq \sigma)$ como medida de la cola

Sé que una de las medidas estándar para el "tailedness" de una distribución es la curtosis, es decir, el cuarto momento central estandarizado $\frac{\mu_4}{\sigma^4}$ . Esta medida me resulta algo intuitiva: como la 4ª potencia "castiga" a los valores atípicos mucho más que la 2ª potencia de la varianza, cabría esperar que una distribución con una cola pesada tuviera una curtosis grande.

Recientemente, se me ocurrió utilizar otra medida de la cola: calcular el contenido de la probabilidad "lejos" de la media, llamemos a esta medida $T$ (por "cola"). A continuación, $$T(X) = \mathbb{P}(\lvert X - \mu\rvert\geq\sigma)$$ donde $X$ es una variable aleatoria cuya cola estamos midiendo, con $\mu = \operatorname{E}X$ y $\sigma^2 = \operatorname{Var}(X)$

También podríamos utilizar diferentes múltiplos de $\sigma$ en la definición (que, sin embargo, también limitaría el valor de $T$ a menos de $1$ debido a la desigualdad de Chebyshev).

¿Se ha utilizado esta medida para juzgar la cola de una distribución? ¿Cuáles son las propiedades que hacen que no se utilice (ampliamente)? Me parece que sería una buena forma de captar el "fenómeno del modelo de negocio de Amazon", donde pueden explotar el contenido de alta probabilidad general entre los títulos de nicho:

3voto

Cliff AB Puntos 3213

Un atributo de la estadística $P(|X - \mu| \ge \sigma)$ es que sólo da una única instantánea de la "cola" que puede captar lo que queremos al comparar distribuciones muy específicas, pero es muy engañosa para otras. Como ejemplo, consideremos una Bernoulli con $p = 0.5$ . Según esta métrica, tiene una cola muy pesada, aunque la mayoría no la consideraría una distribución de cola pesada.

Como ha señalado, esta estadística puede ajustarse cambiando $P(|X - \mu| \ge \sigma)$ a $P(|X - \mu| \ge \lambda \sigma)$ . Obsérvese que si hacemos $\lambda = 1 + \epsilon$ en lugar de $\lambda = 1$ Nuestro Bernoulli va desde las colas más pesadas posibles (según esta métrica) hasta las colas más ligeras posibles. Esto sugiere que tendríamos que considerar esta métrica en un rango de $\lambda$ para tener una visión significativa de nuestra distribución y no sólo un valor particular de $\lambda$ .

Dicho esto, evaluar $P(|X - \mu| \ge \lambda \sigma)$ para los valores $\lambda = 1, 2, 3,...$ puede ayudar a proporcionar algunas medidas interpretables de cómo decaen las colas de una distribución, sobre todo teniendo en cuenta que la mayoría de los analistas saben que esta métrica es aproximadamente 0,32, 0,05 y 0,003 para la distribución normal con $\lambda = 1,2,3$ .

2voto

Vitaly Zdanevich Puntos 95

Es intuitivo como dices. Pero, no creo que sea más informativo que la curtosis porque las probabilidades de tales desigualdades no dan mucha pista sobre la distribución después de los límites. Para ser más específicos, llamemos a $Z=\frac{|X-\mu|}{\sigma}$ y calcular $P(Z\geq k)$ como $0.01$ . Densidad de $Z$ después de $k$ podría estar enfocado cerca de $k$ o muy lejos de ella. En cualquiera de los dos casos, tendrías la misma probabilidad. Sin embargo, $E[Z^4]$ diferirían inmensamente.

2voto

Peter Westfall Puntos 11

Las distribuciones con colas más pesadas no tienen necesariamente "más probabilidad en las colas extremas", como a veces se piensa. Véase aquí un contraejemplo. https://math.stackexchange.com/a/2510884/472987

Son los valores raros y extremos los que caracterizan las colas pesadas. La distribución Bernoulli(p) es un buen ejemplo: Cuanto más pequeña es p, más pesada es la cola, en el sentido de que el evento raro es más extremo, medido por el número de desviaciones estándar de la media.

La curtosis es una buena medida del peso de la cola (basada en cuantiles para momentos infinitos, pero para datos reales, la curtosis de Pearson ordinaria funciona).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X