El primer punto es que todas las distribuciones con una desviación estándar o varianza finita satisfacen la desigualdad de Chebyshev $$\mathbb P(|X-\mu|\geq k\sigma) \leq \frac{1}{k^2}$$ así que, para tomar su ejemplo, no más de $0.01$ es decir $1\%$ de la distribución puede ser $10$ desviaciones estándar o más de la media.
Pero para la mayoría de las distribuciones se trata de un límite muy flojo:
-
Para una distribución normal $2\Phi(-10)\approx 1.5 \times 10^{-23}$ por lo que es la proporción de la distribución que es $10$ desviaciones estándar o más de la media, mucho menos que el límite de Chebyshev.
-
Para un ejemplo de una distribución de ley de potencia con una desviación estándar finita, digamos una distribución de Pareto con un mínimo $1$ y la forma $3$ Así que con la media $\frac32$ y la desviación estándar $\frac{\sqrt{3}}{2}$ la proporción de la distribución $10$ desviaciones estándar o más de la media es aproximadamente $0.00095$ alrededor de una décima parte del límite de Chebyshev.
Eso parece confirmar tu intuición.
Pero creo que Taleb podría estar diciendo que un suceso extremo no debería definirse por el número de desviaciones estándar que tiene con respecto a la media, sino simplemente por la improbabilidad de que ocurra (o algo más extremo). En ese sentido, hay tantos sucesos extremos con una distribución continua como con otra, y la diferencia entre ellas es lo lejos que están esos sucesos extremos de la media.
Por ejemplo, estableciendo "extremo" como una probabilidad de $10^{-6}$ y con la misma media $\frac32$ y s.d. $\frac{\sqrt{3}}{2}$ ,
- una distribución normal tendría como valores "extremos" los que están por debajo de $-2.74$ y superiores $5.74$
- una distribución de Pareto con un mínimo $1$ y la forma $3$ tendrían valores "extremos" siendo los que están por encima de $100$
y en este sentido los valores "extremos" son más consecuentes en el caso de Pareto