69 votos

Taleb y el Cisne Negro

El libro de Taleb "El cisne negro" fue un best seller del New York Times cuando se publicó hace varios años. El libro está ahora en su segunda edición. Después de reunirse con estadísticos en un JSM (una conferencia anual de estadística), Taleb atenuó un poco sus críticas a la estadística. Pero la idea central del libro es que la estadística no es muy útil porque se basa en la distribución normal y en sucesos muy raros: Los "cisnes negros" no tienen distribuciones normales.

¿Cree que es una crítica válida? ¿Pasa Taleb por alto algunos aspectos importantes de la modelización estadística? ¿Pueden predecirse los acontecimientos raros, al menos en el sentido de que puedan estimarse las probabilidades de que ocurran?

73voto

Ted Puntos 854

Leí el Cisne Negro hace un par de años. La idea del Cisne Negro es buena y el ataque a la falacia lúdica (ver las cosas como si fueran juegos de dados, con probabilidades conocidas) es bueno, pero la estadística está escandalosamente tergiversada, siendo el problema central la afirmación errónea de que toda la estadística se desmorona si las variables no están distribuidas normalmente. Este aspecto me molestó lo suficiente como para escribirle a Taleb la carta que sigue:

Estimado Dr. Taleb

Hace poco leí "El cisne negro". Al igual que usted, soy un admirador de Karl Popper, y me encontré de acuerdo con gran parte de su contenido. Creo que su exposición de la falacia lúdica es básicamente sólida, y llama la atención sobre un problema real y común. Sin embargo, creo que gran parte de la Parte III defrauda su argumento general, hasta el punto de desacreditar posiblemente el resto del libro. Es una pena, ya que creo que los argumentos relativos a los cisnes negros y a las "incógnitas desconocidas" se sostienen por sus propios méritos sin necesidad de apoyarse en algunos de los errores de la Parte III.

La cuestión principal que deseo señalar -y sobre la que busco su respuesta, en particular si he entendido mal las cuestiones- es su tergiversación del campo de la estadística aplicada. En mi opinión, los capítulos 14, 15 y 16 dependen en gran medida de un argumento de hombre de paja, tergiversando la estadística y la econometría. El campo de la econometría que usted describe no es el que me enseñaron cuando estudié estadística aplicada, econometría y teoría del riesgo actuarial (en la Universidad Nacional de Australia, pero utilizando textos que parecían bastante estándar). Las cuestiones que planteas (como las limitaciones de las distribuciones gaussianas) se entienden y se enseñan bien, incluso a nivel de licenciatura.

Por ejemplo, usted se esfuerza por demostrar que la distribución de la renta no sigue una distribución normal, y lo presenta como un argumento contra la práctica estadística en general. Ningún estadístico competente afirmaría jamás que lo hace, y las formas de tratar esta cuestión están bien establecidas. Simplemente utilizando técnicas del nivel más básico de "primer año de econometría", por ejemplo, transformar la variable tomando su logaritmo haría que sus ejemplos numéricos parecieran mucho menos convincentes. De hecho, esa transformación invalidaría gran parte de lo que dices, porque entonces la varianza de la variable original sí aumenta a medida que lo hace su media.

Estoy seguro de que hay econometristas incompetentes que hacen regresiones OLS, etc., con una variable de respuesta no transformada como usted dice, pero eso sólo los convierte en incompetentes y en usuarios de técnicas que están bien establecidas como inapropiadas. Seguramente habrían suspendido incluso en los cursos de licenciatura, que dedican mucho tiempo a buscar formas más apropiadas de modelizar variables como la renta, reflejando la distribución real observada (no gaussiana).

La familia de los modelos lineales generalizados es un conjunto de técnicas desarrolladas en parte para evitar los problemas que usted plantea. Muchas de las distribuciones de la familia exponencial (por ejemplo, las distribuciones Gamma, Exponencial y Poisson) son asimétricas y tienen una varianza que aumenta a medida que se incrementa el centro de la distribución, lo que evita el problema que usted señala al utilizar la distribución Gaussiana. Si esto sigue siendo demasiado limitante, es posible prescindir por completo de una "forma" preexistente y especificar simplemente una relación entre la media de una distribución y su varianza (por ejemplo, permitiendo que la varianza aumente proporcionalmente al cuadrado de la media), utilizando el método de estimación de "cuasi-verosimilitud".

Por supuesto, se puede argumentar que esta forma de modelar sigue siendo demasiado simplista y una trampa intelectual que nos hace pensar que el futuro será como el pasado. Puede que tengas razón, y creo que el punto fuerte de tu libro es hacer que gente como yo se lo plantee. Pero necesitas argumentos diferentes a los que utilizas en los capítulos 14-16. El gran peso que le das al hecho de que la varianza de la distribución gaussiana es constante independientemente de su media (lo que causa problemas de escalabilidad), por ejemplo, no es válido. También lo es el énfasis que pones en el hecho de que las distribuciones de la vida real tienden a ser asimétricas en lugar de curvas de campana.

Básicamente, has tomado una simplificación excesiva del enfoque más básico de la estadística (la modelización ingenua de las variables brutas como si tuvieran distribuciones gaussianas) y has mostrado, con gran detalle, (correctamente) las deficiencias de un enfoque tan simplificado. A continuación, usted utiliza esto para hacer el vacío para desacreditar todo el campo. Se trata de un grave error de lógica o de una técnica de propaganda. Es lamentable porque desvirtúa su argumento general, gran parte del cual (como he dicho) me pareció válido y persuasivo.

Me interesaría escuchar su respuesta. Dudo que sea el primero en plantear esta cuestión.

Le saluda atentamente

PE

29voto

kjetil b halvorsen Puntos 7012

Sí leí "El cisne negro", lo disfruté, y soy estadístico. No me pareció insoportable su "crítica a la estadística", en absoluto. Punto por punto:

  1. Taleb no inventó el concepto de cisne negro. Era un ejemplo favorito en el pensamiento filosófico desde hacía tiempo.
  2. Taleb no critica tanto la "estadística" como ciertas (malas) aplicaciones de la misma.
  3. El libro fue un éxito de ventas. No estaba dirigido a los estadísticos, sino al público en general. Hizo muy bien en enseñar a ese público cosas que los estadísticos sabían muy bien, pero que muchos de los otros lectores (¡la mayoría!) no sabían. Así que podríamos aprender mucho de ese libro sobre cómo "vender" la estadística.
  4. Lo más importante (para mí) es que Taleb incluyó muchas referencias a la antigua filosofía escéptica griega. Nadie más ha mencionado ese punto aquí, pero creo que esa inclusión fue el verdadero punto de venta del libro.
  5. El libro es una obra literaria, no una obra técnica. Si quiere criticar a Taleb por su obra técnica, vaya a su página web y descargue algunos de sus trabajos técnicos.

Para los que no les guste esta respuesta, o no les guste el libro, pueden echar un vistazo a los argumentos técnicos de Taleb en el nuevo https://fernandonogueiracosta.files.wordpress.com/2014/07/taleb-nassim-silent-risk.pdf "Riesgo silencioso", que es técnica.

24voto

John Richardson Puntos 1197

No he leído el libro, pero como se ha dicho la crítica me parece bastante poco razonable. Si los eventos extremos son importantes, entonces la estadística tiene herramientas apropiadas en la caja de herramientas, como la teoría de los valores extremos, y un buen estadístico sabrá cómo usarlas (o al menos descubrirá cómo usarlas y estará lo suficientemente comprometido con el propósito del análisis para mirar). La crítica parece ser "la estadística es mala porque hay malos estadísticos que sólo saben de distribuciones normales".

20voto

user1105818 Puntos 16

Decir que "la idea central del libro es que la estadística no es muy útil" es inexacto, creo. Tras leer el libro, lo que parece decir es que cosas como las finanzas cuantitativas o cualquier tipo de comercio de valores que asuma una distribución normal es fundamentalmente defectuoso (de hecho, en el libro, llama "charlatanes" a las personas que afirman utilizar estos modelos para hacer predicciones). Según Taleb, mientras que la distribución normal hace un gran trabajo al modelar los valores de las cosas tangibles/físicas (por ejemplo, la altura, el peso, la duración de la vida, etc.), los sistemas como los mercados a menudo son impulsados por las emociones humanas y, por lo tanto, son propensos a grandes oscilaciones que las distribuciones normales no pueden predecir con precisión.

No entiendo bien la estadística, y hasta leer las respuestas aquí, nunca había oído hablar de cosas como la teoría del valor extremo. En cualquier caso, El cisne negro y Engañado por el azar parecen tener premisas similares, que es "la distribución normal no siempre está bien". No recuerdo que haya difamado a todo el campo de la estadística.

13voto

user36280 Puntos 21

Recomiendo encarecidamente la reseña de Dennis Lindley sobre este libro. Contiene una serie de argumentos demoledores contra la pobre y arrogante exposición de ideas del libro:

http://onlinelibrary.wiley.com/doi/10.1111/j.1740-9713.2008.00281.x/abstract

El Cisne Negro es otro ejemplo en el que ser un "Best-seller" no garantiza un contenido de alta calidad.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X