Interesante pregunta filosóficamente. Voy a dar y responder, pero yo que puede ser corregido matemáticamente.
La idea es que usted vaya en el experimento con una hipótesis nula, o como mi profesor de estadística solía decir, "el aburrido y poco interesante resultado." Por LO tanto, si usted está tratando de demostrar que el tabaco provoca la muerte a principios de, la hipótesis nula es "fumar no lleva a la muerte a principios", lo que significa que la edad promedio de un fumador es el mismo que el de un no fumador si se dibujan de forma aleatoria de entre el mundo real.
La estadística es demostrar que el "aburrido" resultado no se sostienen, ya que las probabilidades de que eso ocurra la vista de los datos que usted miró la hace altamente improbable que era sólo debido a la aleatoriedad que los promedios no son lo suficientemente cerca. Piénsalo de esta forma: si usted tiene exactamente un fumador y no fumador, usted realmente no tiene datos suficientes para hacer tal determinación (especialmente si el no-fumador fue asesinado por un autobús). Pero, si usted tiene 10 millones de cada uno, usted puede tener un montón de precisión (o confianza), estadísticamente hablando, si no obtiene los promedios que están cerca el uno del otro.
Creo que el alfa de la lógica trata de entrar en ella. La pregunta es, a priori, cuál es el nivel de confianza de hacerlo que espera (o sería aceptable) para hacer creer que la hipótesis nula fue mal? Para una cosa, que le impide diseñar el experimento de tal manera que lo que usted realmente cree en su corazón (y es consistente con el experimento de configurar) es que "el 95% sería realmente convincente" no conduce a su análisis de los datos, obteniendo el 92%, y luego decir: "el 90% que la hace verdadera".
El nivel de significación de los cambios por el campo. En algunas áreas de la física de partículas, por ejemplo, donde registran miles de millones de 'eventos' en busca de algo difícil de alcanzar, el estándar es de 5 - o 6-sigma. De lo contrario, usted va a encontrar falsos positivos todo el tiempo, dado el número de eventos. Eso es un ejemplo de cómo el experimento juega en ella.
Por otro lado, cuando hice el negocio de consultoría, que a menudo se presentan las regresiones con el 75% de los p-valores. La lógica es que las empresas deben hacer un montón de decisiones, y un montón de decisiones que tienen un p-valor de 75% que hacer rápidamente (y puede ser revertido si se confirma el mal) es mucho más útil que probar un pequeño número de cosas en un 99% de confianza.
No estoy seguro de que esto es completamente ayudar o responder a lo que usted está pidiendo, pero en la práctica (especialmente en un campo como el de la economía) la gente de hacer lo tratan como continua. Ninguna de las variables que salen de regresión con un p-valor de 95% se siente muy fuerte; ninguna por encima del 90% parecen muy fuertes, pero no ignorar una variable en un 89%. En economía, un problema es que realmente no diseño de experimentos, y los datos pueden ser un poco "sucio".
Tal vez otra forma de ver esto es de lima este: supongamos que son las pruebas de diagnóstico de detección contra una enfermedad que seguramente está fatal, pero el tratamiento en sí mata a 10% de las personas que la padecen, si tienen o no la enfermedad, pero ahorra el 100% de las personas que tienen la enfermedad (imagine que el Ébola o el SIDA en los primeros años). Pero supongamos que sólo el 0,1% (uno de cada 1.000 pacientes) de la población está infectada. Si la prueba da un 5% de falsos positivos, y perfecto reales positivos, esto significa que de cada 1000 personas probado 1 se tiene la enfermedad, pero 51 pondrá a prueba positivo (el real y el 50 false). Eso significa que el fármaco va a matar, de cada 1000 personas probado, 5.1 personas - de los cuales sólo uno tenía la enfermedad. Por lo tanto, sería mejor no utilizar la prueba porque sin ella no sólo será una muerte. Claramente, en ese caso, se ven en la necesidad de un "más estrictos" alfa a priori para justificar demostrando que el uso de la prueba es una buena idea.
Eso es todo un poco descuidado técnicamente, pero creo que lo consigue en lo que están pidiendo.