Estaba leyendo este artículo en Nature en el que algunas falacias se explican en el contexto de análisis de datos. Me di cuenta de que el Texas tirador de primera falacia fue particularmente difícil de evitar:
Un cognitiva de la trampa que le espera durante el análisis de los datos es ilustrado por la fábula de la Texas tirador: un inepto tirador que dispara un patrón aleatorio de las balas en el lado de un granero, dibuja un destino alrededor el mayor grupo de agujeros de bala, y señala con orgullo en su éxito.
Su diana es obviamente ridículo - pero la falacia no es así obvio a los jugadores que creen en un "mano caliente" cuando tienen un racha de victorias, o a las personas que ven sobrenatural importancia, cuando un los sorteos de la lotería viene como todos los números impares.
Ni siempre es evidente para los investigadores. "Usted acaba de conseguir algunos el aliento de los datos y, a continuación, pensar, bueno, este es el camino a ir abajo", dice Pashler. "No se dan cuenta de que tenía 27 de diferentes opciones y eligió el que te dio la más agradable o resultados interesantes, y ahora estás involucrado en algo que no es toda una representación objetiva de los datos."
Creo que ese tipo de trabajos de exploración es común y, a menudo, las hipótesis se construyen basándose en que parte del análisis. Hay un enfoque completo (EDA) dedicados a este proceso:
Análisis exploratorio de datos fue promovido por John Tukey para fomentar los estadísticos para explorar los datos, y, posiblemente, de formular hipótesis que podría conducir a la obtención de nuevos datos y experimentos
Se ve como cualquier proceso de exploración se realiza sin tener una hipótesis de antemano es propenso a generar falsos hipótesis.
Observe que la descripción de EDA arriba en realidad habla sobre new data collection and experiments
. Entiendo que después de que los datos han sido recogidos, a continuación, una confirmación de análisis de datos (CDA) es la adecuada. Sin embargo, no creo que esta distinción es muy clara, y a pesar de una separación de la EDA y CDA sería lo ideal, sin duda hay algunas circunstancias en las que esto no es factible. Yo iría tan lejos como para decir que después de esta separación estrictamente es poco frecuente y la mayoría de los practicantes no suscribirse a la EDA de paradigma en todos.
Así que mi pregunta es: ¿EDA (o cualquier proceso informal de la exploración de datos), es más probable caída para el Texas tirador de primera falacia?