Hay una buena razón para estas definiciones, que se hace más clara cuando se examina la forma general de los momentos de las variables aleatorias normalizadas. Para responder a esta pregunta, consideremos primero la forma general de la variable aleatoria normalizada $k$ th momento central normalizado : $^\dagger$
$$\phi_k = \mathbb{E} \Bigg[ \Bigg( \frac{X - \mathbb{E}[X]}{\mathbb{S}[X]} \Bigg)^k \text{ } \Bigg].$$
Los dos primeros momentos centrales normalizados son los valores $\phi_1=0$ y $\phi_2=1$ que se cumplen para todas las distribuciones para las que la cantidad anterior está bien definida. Por lo tanto, podemos considerar los momentos centrales normalizados no triviales que se dan para valores $k \geqslant 3$ . Para facilitar nuestro análisis definimos:
$$\begin{equation} \begin{aligned} \phi_k^+ &= \mathbb{E} \Bigg[ \Bigg| \frac{X - \mathbb{E}[X]}{\mathbb{S}[X]} \Bigg|^k \text{ } \Bigg| X > \mathbb{E}[X] \Bigg] \cdot \mathbb{P}(X > \mathbb{E}[X]), \\[8pt] \phi_k^- &= \mathbb{E} \Bigg[ \Bigg| \frac{X - \mathbb{E}[X]}{\mathbb{S}[X]} \Bigg|^k \text{ } \Bigg| X < \mathbb{E}[X] \Bigg] \cdot \mathbb{P}(X < \mathbb{E}[X]). \end{aligned} \end{equation}$$
Se trata de cantidades no negativas que dan el $k$ th absoluto potencia de la variable aleatoria normalizada condicional a que esté por encima o por debajo de su valor esperado. A continuación descompondremos el momento central normalizado en estas partes.
Valores impar de $k$ medir la inclinación de las colas: Para cualquier valor impar de $k \geqslant 3$ tenemos una potencia impar en la ecuación del momento y así podemos escribir el momento central normalizado como $\phi_k = \phi_k^+ - \phi_k^-$ . De esta forma vemos que el momento central normalizado nos da la diferencia entre el $k$ a potencia absoluta de la variable aleatoria normalizada, condicional a que esté por encima o por debajo de su media, respectivamente.
Así, para cualquier potencia impar $k \geqslant 3$ obtendremos una medida que da valores positivos si la potencia absoluta esperada de la variable aleatoria estandarizada es mayor para valores por encima de la media que para valores por debajo de la media, y da valores negativos si la potencia absoluta esperada es menor para valores por encima de la media que para valores por debajo de la media. Cualquiera de estas cantidades podría considerarse razonablemente como una medida de un tipo de "asimetría", en la que las potencias más elevadas otorgan un mayor peso relativo a los valores alejados de la media.
Dado que este fenómeno se produce para cada potencia impar $k \geqslant 3$ la elección natural para una medida arquetípica de "asimetría" es definir $\phi_3$ como la asimetría. (Los momentos Impares de orden superior $k=5,7,9,...$ Se trata de un momento central normalizado inferior a las potencias impar superiores, y es natural explorar los momentos de orden inferior antes de considerar los momentos de orden superior. En estadística hemos adoptado la convención de referirnos a este momento central normalizado como el asimetría ya que es el momento central normalizado más bajo que mide este aspecto de la distribución. (Las potencias impar más altas también miden tipos de asimetría, pero con un énfasis cada vez mayor en los valores alejados de la media; a veces se denominan medidas de "hipersexualidad").
Incluso los valores de $k$ medir el engrasamiento de las colas: Para cualquier valor par de $k \geqslant 3$ tenemos una potencia par en la ecuación del momento, por lo que podemos escribir el momento central normalizado como $\phi_k = \phi_k^+ + \phi_k^-$ . De esta forma vemos que el momento central normalizado nos da la suma de los $k$ a potencia absoluta de la variable aleatoria normalizada, condicional a que esté por encima o por debajo de su media, respectivamente.
Así, para cualquier potencia par $k \geqslant 3$ obtendremos una medida que da valores no negativos, con valores más altos si las colas de la distribución de la variable aleatoria normalizada son más gordas. Obsérvese que se trata de un resultado con respecto a la estandarizado variable aleatoria, por lo que un cambio de escala (cambio de la varianza) no tiene ningún efecto sobre esta medida. Se trata más bien de una medida de la gordura de las colas, una vez normalizada la varianza de la distribución. Cualquiera de estas cantidades podría considerarse razonablemente como una medida de un tipo de "curtosis", en la que las potencias más altas dan mayor peso relativo a los valores que se alejan de la media.
Dado que este fenómeno se produce para cada potencia par $k \geqslant 3$ la elección natural para una medida arquetípica de curtosis es definir $\phi_4$ como la curtosis. Se trata de un momento central normalizado inferior a las potencias pares superiores, y es natural explorar los momentos de orden inferior antes de considerar los momentos de orden superior. En estadística hemos adoptado la convención de referirnos a este momento central normalizado como "curtosis", ya que es el momento central normalizado más bajo que mide este aspecto de la distribución. (Las potencias pares superiores también miden tipos de curtosis, pero con un énfasis cada vez mayor en los valores alejados de la media; a veces se denominan medidas de "hipercurtosis").
$^\dagger$ Esta ecuación está bien definida para cualquier distribución cuyos dos primeros momentos existan, y que tenga varianza distinta de cero. Supondremos que la distribución de interés pertenece a esta clase para el resto del análisis.