El humor es algo muy personal -algunas personas lo encontrarán divertido, pero puede que no lo sea para todo el mundo- y los intentos de explicar lo que hace que algo sea divertido a menudo no consiguen transmitir lo divertido, aunque expliquen el punto subyacente. De hecho, no todos los xkcd pretenden ser realmente graciosos. Sin embargo, muchos de ellos plantean puntos importantes que invitan a la reflexión, y al menos a veces resultan divertidos. (A mí personalmente me hace gracia, pero me resulta difícil explicar con claridad qué es lo que me hace gracia exactamente. Creo que en parte es el reconocimiento de la forma en que un resultado dudoso, o incluso dudoso, se convierte en un circo mediático ( sobre lo cual ver también esto Cómic de doctorado ), y tal vez en parte el reconocimiento de la forma en que algunas investigaciones pueden hacerse realmente, aunque normalmente no de forma consciente).
Sin embargo, uno puede apreciar el punto tanto si le hace cosquillas como si no.
Se trata de hacer múltiples pruebas de hipótesis con un nivel de significación moderado, como el 5%, y luego publicar la que haya resultado significativa. Por supuesto, si se realizan 20 pruebas de este tipo cuando realmente no hay nada importante, el número esperado de esas pruebas para dar un resultado significativo es 1. Haciendo una aproximación en cabeza para $n$ pruebas a nivel de significación $\frac{1}{n}$ En cuanto a los resultados, hay aproximadamente un 37% de probabilidades de que no haya ningún resultado significativo, un 37% de probabilidades de que haya uno y un 26% de probabilidades de que haya más de uno (acabo de comprobar las respuestas exactas; son bastante aproximadas).
En el cómic, Randall representó 20 pruebas, por lo que sin duda este es su punto de vista (que se espera obtener una significativa incluso cuando no hay nada). El artículo del periódico ficticio incluso enfatiza el problema con el subtítulo "¡Sólo un 5% de posibilidades de coincidencia!". (Si la única prueba que acabó en los periódicos fue la única que se hizo, ese podría ser el caso).
Por supuesto, también está la cuestión más sutil de que un investigador individual puede comportarse de forma mucho más razonable, pero el problema de la publicidad desenfrenada de los falsos positivos todavía se produce. Digamos que estos investigadores sólo hacen 5 pruebas, cada una de ellas con un nivel del 1%, por lo que su probabilidad global de descubrir un resultado falso como ése es sólo del 5%.
Hasta aquí todo bien. Pero ahora imagina que hay 20 grupos de investigación de este tipo, cada uno probando cualquier subconjunto aleatorio de colores que crean que tienen motivos para probar. O 100 grupos de investigación... ¿qué posibilidades hay de que salga un titular como el del cómic ahora?
Así que, en términos más generales, el cómic puede estar haciendo referencia al sesgo de la publicación en general. Si sólo se anuncian los resultados significativos, no oiremos hablar de las docenas de grupos que no encontraron nada para las gominolas verdes, sino sólo del que sí lo hizo.
De hecho, ese es uno de los principales puntos que se plantean en este artículo que ha sido noticia en los últimos meses ( Por ejemplo, aquí aunque se trata de un artículo de 2005).
A respuesta a ese artículo destaca la necesidad de replicar. Hay que tener en cuenta que si hubiera varias réplicas del estudio que se publicó, el resultado "Gominolas verdes vinculadas al acné" sería muy poco probable que se mantuviera.
(Y, de hecho, el texto que aparece en el cómic hace una ingeniosa referencia al mismo punto).