Su preocupación es exactamente la preocupación que subyace en gran parte de la discusión actual en las ciencias acerca de la reproducibilidad. Sin embargo, el verdadero estado de las cosas es un poco más complicado de lo que te sugieren.
En primer lugar, vamos a establecer que parte de la terminología. Hipótesis nula pruebas de significación puede ser entendido como una señal de la detección del problema, la hipótesis nula es verdadera o falsa, y usted puede elegir para rechazar o retener. La combinación de dos sentencias y dos posibles "true" estados de cosas y los resultados en la siguiente tabla, que la mayoría de la gente vea en algún momento cuando están en el primer aprendizaje de la estadística:
![enter image description here]()
Los científicos que utilizan la hipótesis nula pruebas de significación están tratando de maximizar el número de decisiones correctas (en azul) y minimizar el número de decisiones incorrectas (mostrado en rojo). El trabajo de los científicos también están tratando de publicar sus resultados de manera que puedan obtener puestos de trabajo y avanzar en sus carreras.
Por supuesto, tener en cuenta que, como muchos otros ms responden ya he mencionado, la hipótesis nula no es elegido al azar, sino que es generalmente elegido específicamente porque, basado en el previo de la teoría, el científico cree que es falsa. Desafortunadamente, es difícil cuantificar la proporción de veces que los científicos son correctos en sus predicciones, pero ten en cuenta que, cuando los científicos están tratando con el "$H_0$ es falso" de la columna, que debería estar preocupado acerca de los falsos negativos en lugar de positivos falsos.
Usted, sin embargo, parecen estar preocupados acerca de los falsos positivos, así que vamos a centrarnos en el "$H_0$ es cierto que en la columna". En esta situación, ¿cuál es la probabilidad de que un científico de la publicación de un resultado falso?
El sesgo de publicación
Mientras la probabilidad de que la publicación no depende de si el resultado es "significativo", entonces la probabilidad es, precisamente, % # % # % -- .05, y a veces menos, dependiendo del campo. El problema es que hay buena evidencia de que la probabilidad de que la publicación no dependen de si el resultado es significativo (véase, por ejemplo, Stern & Simes, 1997; Dwan et al., 2008), ya sea porque los científicos sólo presentar resultados significativos para la publicación (el llamado archivo-cajón problema; Rosenthal, 1979) o porque no significativos, los resultados son presentados para su publicación, pero no lo hacen a través de la revisión de pares.
El problema general de la probabilidad de publicación dependiendo de la observó $\alpha$-valor es lo que se entiende por sesgo de publicación. Si damos un paso atrás y pensar acerca de las implicaciones de sesgo de publicación para una investigación más amplio de la literatura, una literatura de investigación afectados por el sesgo de publicación todavía contienen verdaderos resultados - a veces la hipótesis nula de que un científico afirma ser falso, realmente será falsa, y, dependiendo del grado de sesgo de publicación, a veces, un científico correctamente afirmación de que una determinada hipótesis nula es verdadera. Sin embargo, la literatura de la investigación también será desordenado por demasiado grande la proporción de falsos positivos (es decir, estudios en los que el investigador afirma que la hipótesis nula es falsa cuando en realidad es verdadera).
Investigador grados de libertad
El sesgo de publicación no es la única forma en la que, bajo la hipótesis nula, la probabilidad de que la publicación de un resultado significativo será mayor que $p$. Dada la presencia de un número suficientemente grande de las cuestionables prácticas de la investigación, la tasa de falsos positivos puede ir tan alto como .60 incluso si la tasa nominal se fijó en .05 (Simmons, Nelson, & Simonsohn, 2011).
Es importante tener en cuenta que el uso inadecuado de investigador grados de libertad (que es a veces conocido como un cuestionable práctica de investigación; Martinson, Anderson, & de Vries, 2005) es que no es lo mismo que hacer de los datos. En algunos casos, excluyendo los valores atípicos es la cosa correcta a hacer, ya sea porque el equipo falla o por alguna otra razón. La cuestión clave es que, en la presencia del investigador grados de libertad, las decisiones tomadas durante el análisis, a menudo dependen de cómo los datos resultan (Gelman Y Loken, 2014), incluso si los investigadores en cuestión no son conscientes de este hecho. Mientras los investigadores utilizan investigador grados de libertad (consciente o inconscientemente) para aumentar la probabilidad de un resultado significativo (tal vez porque significativa los resultados son más "publicable"), la presencia de investigador grados de libertad se sobrepoblan una investigación de la literatura con los falsos positivos de la misma manera como el sesgo de publicación.
Una advertencia importante para la discusión anterior es que los documentos científicos (al menos en psicología, que es mi campo) rara vez se componen de resultados individuales. Más comunes son múltiples estudios, cada uno de los cuales involucra a múltiples pruebas-el énfasis está en la construcción de una mayor argumento y descartar explicaciones alternativas para las pruebas presentadas. Sin embargo, el selectivo de la presentación de resultados (o de la presencia del investigador grados de libertad), que puede producir un sesgo en un conjunto de resultados tan fácilmente como un resultado único. Hay evidencia de que los resultados que se presentan en múltiples documentos de estudio es a menudo mucho más limpio y más fuerte que uno podría esperar, incluso si todas las predicciones de estos estudios se llevaron a toda la verdad (Francisco de 2013).
Conclusión
Fundamentalmente, estoy de acuerdo con su intuición de que la hipótesis nula pruebas de significación puede ir mal. Sin embargo, yo diría que a los verdaderos culpables de la producción de una alta tasa de falsos positivos son procesos como el sesgo de publicación y la presencia del investigador grados de libertad. De hecho, muchos científicos son conscientes de estos problemas, y la mejora científica de la reproducibilidad es muy activo, el tema actual de discusión (por ejemplo, Nosek Y Bar-Anan, 2012; Nosek, Espías, Y Motyl, 2012). Así que usted está en buena compañía con sus preocupaciones, pero también creo que también hay motivos para algo de optimismo cauteloso.
Referencias
Stern, J. M., & Simes, R. J. (1997). Sesgo de publicación: Evidencia de retraso en la publicación de un estudio de cohorte de proyectos de investigación clínica. BMJ, 315(7109), 640-645. http://doi.org/10.1136/bmj.315.7109.640
Dwan, K., Altman, D. G., Arnaiz, J. A., Bloom, J., Alonso, A., Cronin, E., ... Williamson, P. R. (2008). Revisión sistemática de la evidencia empírica de estudio de sesgo de publicación y los resultados de informes de sesgo. La revista PLoS ONE, 3(8), e3081. http://doi.org/10.1371/journal.pone.0003081
Rosenthal, R. (1979). El cajón de archivo problema y la tolerancia de los resultados nulos. Psychological Bulletin, 86(3), 638-641. http://doi.org/10.1037/0033-2909.86.3.638
Simmons, J. P., Nelson, L. D., & Simonsohn, U. (2011). Falso-la psicología positiva: no divulgada de la flexibilidad en la recolección y análisis de datos permite presentar algo tan importante. La Ciencia Psicológica, 22(11), 1359-1366. http://doi.org/10.1177/0956797611417632
Martinson, B. C., Anderson, M. S., & de Vries, R. (2005). Los científicos se comportan mal. La naturaleza, 435, 737-738. http://doi.org/10.1038/435737a
Gelman, A., & Loken, E. (2014). La estadística de la crisis en la ciencia. American Scientist, 102, 460-465.
Francisco, G. (2013). La replicación, la consistencia estadística, y el sesgo de publicación. Diario de Matemáticas Psicología, 57(5), 153-169. http://doi.org/10.1016/j.jmp.2013.02.003
Nosek, B. A., & Bar-Anan, Y. (2012). Utopía científica: I. Apertura de la comunicación científica. Psicológica De La Investigación, 23(3), 217-243. http://doi.org/10.1080/1047840X.2012.692215
Nosek, B. A., Espías, J. R., & Motyl, M. (2012). Utopía científica: II. La reestructuración de incentivos y prácticas para promover la verdad sobre publishability. Perspectivas de la Ciencia Psicológica, 7(6), 615-631. http://doi.org/10.1177/1745691612459058