¿Podría alguien explicar por qué Richard McElreath dice que la prueba exacta de Fisher rara vez se utiliza adecuadamente en su excelente libro de introducción a la Bayesiana ( Replanteamiento estadístico )?
Como referencia, el contexto es el siguiente:
¿Por qué las pruebas no son suficientes para la investigación innovadora? Los procedimientos clásicos de la estadística introductoria tienden a ser inflexibles y frágiles. Por inflexibles, quiero decir que tienen formas muy limitadas de adaptarse a contextos de investigación únicos. Por frágil, quiero decir que fallan de forma imprevisible cuando se aplican a nuevos contextos. Esto es importante, porque en los límites de la mayoría de las ciencias, casi nunca está claro qué procedimiento es el adecuado. Ninguno de los gólems tradicionales ha sido evaluado en contextos de investigación novedosos, por lo que puede ser difícil elegir uno y luego entender cómo se comporta. Un buen ejemplo es la prueba exacta de Fisher, que se aplica (exactamente) a un contexto empírico extremadamente estrecho, pero que se utiliza regularmente siempre que el número de células es pequeño. Personalmente, he leído cientos de usos de la prueba exacta de Fisher en revistas científicas, pero aparte del uso original de Fisher, nunca he visto que se utilice de forma adecuada. Incluso un procedimiento como la regresión lineal ordinaria, que es bastante flexible en muchos aspectos, pudiendo codificar una gran diversidad de hipótesis interesantes, es a veces frágil. Por ejemplo, si hay un error de medición considerable en las variables de predicción, el procedimiento puede fallar de forma espectacular. Pero lo más importante es que casi siempre es posible hacerlo mejor que la regresión lineal ordinaria, en gran parte debido a un fenómeno conocido como sobreajuste.