Mi respuesta corta es que es por diseño. Las medidas de asimetría suelen construirse de forma que la asimetría positiva indique distribuciones sesgadas hacia la derecha.
Hoy en día lo más común es medida de asimetría que también se suele enseñar en las escuelas, se basa en la tercera momento central ecuación de la siguiente manera:
$$\mu_3=E[(X-\mu)^3]$$
Fíjate en la expresión anterior. Cuando hay más peso (de la función de distribución) a la derecha de la media entonces $(x-\mu)^3$ aportará más valores positivos. La derecha de la media es positiva, porque $x>\mu$ y la izquierda es negativa porque $x<\mu$ . Así que, mecánicamente, parece responder exactamente a su pregunta.
Sin embargo, como ha señalado @Nick Cox, hay más de una medida de asimetría, como por ejemplo Primer coeficiente de asimetría de Pearson que se basa en la diferencia $mean-mode$ . Potencialmente, diferentes medidas de asimetría podrían conducir a diferentes relaciones entre la asimetría positiva y la tendencia a tener colas más pesadas a la derecha.
Por lo tanto, es interesante analizar por qué se introdujeron estas medidas de asimetría en primer lugar, y por qué tienen sus formulaciones particulares.
En este contexto, es útil observar la exposición de la asimetría por parte de Yule en Introducción a la teoría de la estadística (1912). En el siguiente extracto describe la propiedades deseadas de una medida de asimetría razonable. Básicamente, exige que la asimetría positiva corresponda a distribuciones sesgadas hacia la derecha, como en tu imagen:
8 votos
Subrayemos que los términos izquierda y derecha dependen de una convención tácita según la cual el eje de magnitud de un gráfico que muestra una distribución es horizontal con valores negativos a la izquierda. Esto puede parecer demasiado obvio como para afirmarlo, excepto para aquellos que hacen las cosas de otra manera.