22 votos

¿Intuición de momentos sobre la media de una distribución?

¿Puede alguien proporcionar una intuición sobre por qué los momentos superiores de una distribución de probabilidad $p_X$ como el tercer y cuarto momentos, corresponden a la asimetría y la curtosis respectivamente? Concretamente, ¿por qué la desviación sobre la media elevada a la tercera o cuarta potencia acaba traduciéndose en una medida de asimetría y curtosis? ¿Hay alguna forma de relacionar esto con la tercera o cuarta derivada de la función?

Considere esta definición de asimetría y curtosis:

$$\begin{matrix} \text{Skewness}(X) = \mathbb{E}[(X - \mu_{X})^3] / \sigma^3, \\[6pt] \text{Kurtosis}(X) = \mathbb{E}[(X - \mu_{X})^4] / \sigma^4. \\[6pt] \end{matrix}$$

En estas ecuaciones elevamos el valor normalizado $(X-\mu)/\sigma$ a una potencia y tomar su valor esperado. No me queda claro por qué elevar la variable aleatoria normalizada a la potencia de cuatro da "picos" o por qué elevar la variable aleatoria normalizada a la potencia de tres debería dar "asimetría". Esto parece mágico y misterioso.

13voto

Aaron Puntos 36

Hay una buena razón para estas definiciones, que se hace más clara cuando se examina la forma general de los momentos de las variables aleatorias normalizadas. Para responder a esta pregunta, consideremos primero la forma general de la variable aleatoria normalizada $k$ th momento central normalizado : $^\dagger$

$$\phi_k = \mathbb{E} \Bigg[ \Bigg( \frac{X - \mathbb{E}[X]}{\mathbb{S}[X]} \Bigg)^k \text{ } \Bigg].$$

Los dos primeros momentos centrales normalizados son los valores $\phi_1=0$ y $\phi_2=1$ que se cumplen para todas las distribuciones para las que la cantidad anterior está bien definida. Por lo tanto, podemos considerar los momentos centrales normalizados no triviales que se dan para valores $k \geqslant 3$ . Para facilitar nuestro análisis definimos:

$$\begin{equation} \begin{aligned} \phi_k^+ &= \mathbb{E} \Bigg[ \Bigg| \frac{X - \mathbb{E}[X]}{\mathbb{S}[X]} \Bigg|^k \text{ } \Bigg| X > \mathbb{E}[X] \Bigg] \cdot \mathbb{P}(X > \mathbb{E}[X]), \\[8pt] \phi_k^- &= \mathbb{E} \Bigg[ \Bigg| \frac{X - \mathbb{E}[X]}{\mathbb{S}[X]} \Bigg|^k \text{ } \Bigg| X < \mathbb{E}[X] \Bigg] \cdot \mathbb{P}(X < \mathbb{E}[X]). \end{aligned} \end{equation}$$

Se trata de cantidades no negativas que dan el $k$ th absoluto potencia de la variable aleatoria normalizada condicional a que esté por encima o por debajo de su valor esperado. A continuación descompondremos el momento central normalizado en estas partes.


Valores impar de $k$ medir la inclinación de las colas: Para cualquier valor impar de $k \geqslant 3$ tenemos una potencia impar en la ecuación del momento y así podemos escribir el momento central normalizado como $\phi_k = \phi_k^+ - \phi_k^-$ . De esta forma vemos que el momento central normalizado nos da la diferencia entre el $k$ a potencia absoluta de la variable aleatoria normalizada, condicional a que esté por encima o por debajo de su media, respectivamente.

Así, para cualquier potencia impar $k \geqslant 3$ obtendremos una medida que da valores positivos si la potencia absoluta esperada de la variable aleatoria estandarizada es mayor para valores por encima de la media que para valores por debajo de la media, y da valores negativos si la potencia absoluta esperada es menor para valores por encima de la media que para valores por debajo de la media. Cualquiera de estas cantidades podría considerarse razonablemente como una medida de un tipo de "asimetría", en la que las potencias más elevadas otorgan un mayor peso relativo a los valores alejados de la media.

Dado que este fenómeno se produce para cada potencia impar $k \geqslant 3$ la elección natural para una medida arquetípica de "asimetría" es definir $\phi_3$ como la asimetría. (Los momentos Impares de orden superior $k=5,7,9,...$ Se trata de un momento central normalizado inferior a las potencias impar superiores, y es natural explorar los momentos de orden inferior antes de considerar los momentos de orden superior. En estadística hemos adoptado la convención de referirnos a este momento central normalizado como el asimetría ya que es el momento central normalizado más bajo que mide este aspecto de la distribución. (Las potencias impar más altas también miden tipos de asimetría, pero con un énfasis cada vez mayor en los valores alejados de la media; a veces se denominan medidas de "hipersexualidad").


Incluso los valores de $k$ medir el engrasamiento de las colas: Para cualquier valor par de $k \geqslant 3$ tenemos una potencia par en la ecuación del momento, por lo que podemos escribir el momento central normalizado como $\phi_k = \phi_k^+ + \phi_k^-$ . De esta forma vemos que el momento central normalizado nos da la suma de los $k$ a potencia absoluta de la variable aleatoria normalizada, condicional a que esté por encima o por debajo de su media, respectivamente.

Así, para cualquier potencia par $k \geqslant 3$ obtendremos una medida que da valores no negativos, con valores más altos si las colas de la distribución de la variable aleatoria normalizada son más gordas. Obsérvese que se trata de un resultado con respecto a la estandarizado variable aleatoria, por lo que un cambio de escala (cambio de la varianza) no tiene ningún efecto sobre esta medida. Se trata más bien de una medida de la gordura de las colas, una vez normalizada la varianza de la distribución. Cualquiera de estas cantidades podría considerarse razonablemente como una medida de un tipo de "curtosis", en la que las potencias más altas dan mayor peso relativo a los valores que se alejan de la media.

Dado que este fenómeno se produce para cada potencia par $k \geqslant 3$ la elección natural para una medida arquetípica de curtosis es definir $\phi_4$ como la curtosis. Se trata de un momento central normalizado inferior a las potencias pares superiores, y es natural explorar los momentos de orden inferior antes de considerar los momentos de orden superior. En estadística hemos adoptado la convención de referirnos a este momento central normalizado como "curtosis", ya que es el momento central normalizado más bajo que mide este aspecto de la distribución. (Las potencias pares superiores también miden tipos de curtosis, pero con un énfasis cada vez mayor en los valores alejados de la media; a veces se denominan medidas de "hipercurtosis").


$^\dagger$ Esta ecuación está bien definida para cualquier distribución cuyos dos primeros momentos existan, y que tenga varianza distinta de cero. Supondremos que la distribución de interés pertenece a esta clase para el resto del análisis.

2voto

Hoogendijk Puntos 45

Pregunta similar ¿Qué tienen de "momentos" los "momentos" de una distribución de probabilidad? Le di un físico responder a la que se dirigió momentos.

"La aceleración angular es la derivada de la velocidad angular, que es la derivada del ángulo con respecto al tiempo, es decir, $ \dfrac{d\omega}{dt}=\alpha,\,\dfrac{d\theta}{dt}=\omega$ . Consideremos que el segundo momento es análogo al par aplicado a un movimiento circular, o si se quiere una aceleración/desaceleración (también segunda derivada) de ese movimiento circular (es decir, angular, $\theta$ ) moción. Del mismo modo, el tercer momento sería una tasa de cambio del par, y así sucesivamente para momentos aún mayores para hacer tasas de cambio de tasas de cambio de tasas de cambio, es decir, derivadas secuenciales del movimiento circular....".

Véase el enlace ya que quizás sea más fácil visualizarlo con ejemplos físicos.

La asimetría es más fácil de entender que la curtosis. Una asimetría negativa es una cola izquierda más pesada (o un valor atípico de dirección más negativa) que a la derecha y una asimetría positiva lo contrario.

Wikipedia cita a Westfall (2014) y da a entender que la curtosis alta surge o bien para variables aleatorias que tienen valores atípicos lejanos o bien para funciones de densidad con una o dos colas pesadas, al tiempo que afirma que cualquier tendencia central de los datos o la densidad tiene relativamente poco efecto en el valor de la curtosis. Los valores bajos de curtosis implicarían lo contrario, es decir, una falta de $x$ -y la ligereza relativa de ambas colas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X