Leí el Cisne Negro hace un par de años. La idea del Cisne Negro es buena y el ataque a la falacia lúdica (ver las cosas como si fueran juegos de dados, con probabilidades conocidas) es bueno, pero la estadística está escandalosamente tergiversada, siendo el problema central la afirmación errónea de que toda la estadística se desmorona si las variables no están distribuidas normalmente. Este aspecto me molestó lo suficiente como para escribirle a Taleb la carta que sigue:
Estimado Dr. Taleb
Hace poco leí "El cisne negro". Al igual que usted, soy un admirador de Karl Popper, y me encontré de acuerdo con gran parte de su contenido. Creo que su exposición de la falacia lúdica es básicamente sólida, y llama la atención sobre un problema real y común. Sin embargo, creo que gran parte de la Parte III defrauda su argumento general, hasta el punto de desacreditar posiblemente el resto del libro. Es una pena, ya que creo que los argumentos relativos a los cisnes negros y a las "incógnitas desconocidas" se sostienen por sus propios méritos sin necesidad de apoyarse en algunos de los errores de la Parte III.
La cuestión principal que deseo señalar -y sobre la que busco su respuesta, en particular si he entendido mal las cuestiones- es su tergiversación del campo de la estadística aplicada. En mi opinión, los capítulos 14, 15 y 16 dependen en gran medida de un argumento de hombre de paja, tergiversando la estadística y la econometría. El campo de la econometría que usted describe no es el que me enseñaron cuando estudié estadística aplicada, econometría y teoría del riesgo actuarial (en la Universidad Nacional de Australia, pero utilizando textos que parecían bastante estándar). Las cuestiones que planteas (como las limitaciones de las distribuciones gaussianas) se entienden y se enseñan bien, incluso a nivel de licenciatura.
Por ejemplo, usted se esfuerza por demostrar que la distribución de la renta no sigue una distribución normal, y lo presenta como un argumento contra la práctica estadística en general. Ningún estadístico competente afirmaría jamás que lo hace, y las formas de tratar esta cuestión están bien establecidas. Simplemente utilizando técnicas del nivel más básico de "primer año de econometría", por ejemplo, transformar la variable tomando su logaritmo haría que sus ejemplos numéricos parecieran mucho menos convincentes. De hecho, esa transformación invalidaría gran parte de lo que dices, porque entonces la varianza de la variable original sí aumenta a medida que lo hace su media.
Estoy seguro de que hay econometristas incompetentes que hacen regresiones OLS, etc., con una variable de respuesta no transformada como usted dice, pero eso sólo los convierte en incompetentes y en usuarios de técnicas que están bien establecidas como inapropiadas. Seguramente habrían suspendido incluso en los cursos de licenciatura, que dedican mucho tiempo a buscar formas más apropiadas de modelizar variables como la renta, reflejando la distribución real observada (no gaussiana).
La familia de los modelos lineales generalizados es un conjunto de técnicas desarrolladas en parte para evitar los problemas que usted plantea. Muchas de las distribuciones de la familia exponencial (por ejemplo, las distribuciones Gamma, Exponencial y Poisson) son asimétricas y tienen una varianza que aumenta a medida que se incrementa el centro de la distribución, lo que evita el problema que usted señala al utilizar la distribución Gaussiana. Si esto sigue siendo demasiado limitante, es posible prescindir por completo de una "forma" preexistente y especificar simplemente una relación entre la media de una distribución y su varianza (por ejemplo, permitiendo que la varianza aumente proporcionalmente al cuadrado de la media), utilizando el método de estimación de "cuasi-verosimilitud".
Por supuesto, se puede argumentar que esta forma de modelar sigue siendo demasiado simplista y una trampa intelectual que nos hace pensar que el futuro será como el pasado. Puede que tengas razón, y creo que el punto fuerte de tu libro es hacer que gente como yo se lo plantee. Pero necesitas argumentos diferentes a los que utilizas en los capítulos 14-16. El gran peso que le das al hecho de que la varianza de la distribución gaussiana es constante independientemente de su media (lo que causa problemas de escalabilidad), por ejemplo, no es válido. También lo es el énfasis que pones en el hecho de que las distribuciones de la vida real tienden a ser asimétricas en lugar de curvas de campana.
Básicamente, has tomado una simplificación excesiva del enfoque más básico de la estadística (la modelización ingenua de las variables brutas como si tuvieran distribuciones gaussianas) y has mostrado, con gran detalle, (correctamente) las deficiencias de un enfoque tan simplificado. A continuación, usted utiliza esto para hacer el vacío para desacreditar todo el campo. Se trata de un grave error de lógica o de una técnica de propaganda. Es lamentable porque desvirtúa su argumento general, gran parte del cual (como he dicho) me pareció válido y persuasivo.
Me interesaría escuchar su respuesta. Dudo que sea el primero en plantear esta cuestión.
Le saluda atentamente
PE