7 votos

¿Cuál es la historia de $p < 0.05$ o el 95% de confianza?

Me pregunto cuál es la historia de $p < 0.05$ o utilizando un intervalo de confianza del 95% es. Sé que un razonamiento más matizado sostendría que no hay nada especial en el 0,05 o el 95% (creo que la teoría de la decisión ofrece orientación sobre el nivel de riesgo que se debe aceptar) y que el uso de estos números tiene más que ver con la "tradición" y con hacer lo que se enseñó en los cursos de estadística que en sí mismos no discuten por qué se deben usar bien estos números.

¿No fue Fisher quien sugirió que $p < 0.05$ era lo suficientemente pequeño como para descartar una hipótesis, y sobre todo como una sugerencia y no como una regla? ¿O me equivoco en eso?

8voto

user164061 Puntos 281

Fisher sugirió el nivel 0,05 indirectamente. Mencionó que dos desviaciones estándar es una regla fácil para la significación, y el nivel 0,05 es lo que aproximadamente corresponde a ella.

Del libro de Fisher de 1925 "Statistical methods for research workers".

Por lo tanto, si conocemos la desviación típica de una población, podemos calcular la desviación típica de la media de una muestra aleatoria de cualquier tamaño, y así comprobar si difiere o no significativamente de cualquier valor fijo. Si la diferencia es muchas veces mayor que el error estándar, es ciertamente significativa, y es una convención conveniente tomar el doble del error estándar como límite de significación; esto es aproximadamente equivalente al límite correspondiente $P=.05$ , ya utilizado para el $\chi^2$ distribución.

También menciona que este nivel ya se utiliza. Se refiere a la prueba de chi cuadrado de Pearson. En el mismo libro escribe sobre la construcción de una tabla para los valores de la $\chi^2$ distribución

no hemos reimpreso la tabla de Elderton, sino que hemos dado una nueva tabla (Tabla III. p. 98) en una forma que la experiencia ha demostrado que es más conveniente. En lugar de dar los valores de $P$ correspondiente a una serie arbitraria de valores de $\chi^2$ hemos dado los valores de $\chi^2$ correspondientes a valores especialmente seleccionados de $P$ . De este modo, hemos podido abarcar de forma compacta aquellas partes de las distribuciones que hasta ahora no estaban disponibles, es decir, los valores de $\chi^2$ menor que la unidad, lo que ocurre con frecuencia para valores pequeños de $n$ y los valores superiores a $30$ que para valores mayores de $n$ se convierten en algo importante.

...

Al elaborar esta tabla hemos tenido en cuenta que en la práctica no queremos saber el valor exacto de $P$ para cualquier observado $\chi^2$ sino, en primer lugar, si el valor observado está abierto a la sospecha. Si $P$ está entre $.1$ y $.9$ ciertamente no hay ninguna razón para sospechar de la hipótesis probada. Si está por debajo de $.02$ se indica fuertemente que la hipótesis no da cuenta de la totalidad de los hechos. No nos equivocaremos a menudo si trazamos una línea convencional en $.05$ y considerar que los valores más altos de $\chi^2$ indican una discrepancia real.

Así que el nivel de 0,05 proviene de dos tipos de conveniencia.

  • Se refiere a la Norma 68-97,5-99,7 y el valor 2 sigma.
  • Y está relacionado con la falta de ordenadores en los viejos tiempos y la necesidad de encontrar valores para las distribuciones a partir de tablas. Para facilitar estas tablas, Fisher pensó que sería mejor dar $\chi^2$ en función de $p$ en lugar de al revés. Así que había que elegir los niveles convenientes para construir ese nuevo tipo de tablas.

5voto

manku Puntos 111

Ver este histórico artículo de Stigler (2008) en El azar, sobre la influencia de Fisher (como usted sugiere).

Gran parte de las primeras pruebas de significación utilizaban la distribución normal estándar. A medida que los valores de corte se hacen más pequeños que $-2.0$ hay una cola que disminuye rápidamente probabilidad. Así que si uno quiere una probabilidad de cola relativamente pequeña sin insistir en $z$ -valores demasiado alejados de $0,$ parece que puntos de corte alrededor de $\pm 2$ dan un equilibrio razonable entre las medidas más extremas z más extremos y menores probabilidades. Si uno quiere números "redondos" para la suma de dos probabilidades de cola, como $0.01, 0.02, 0.03,$ $0.04, 0.05, 0.06,$ etc, entonces algo cercano a $0.05=5\%$ parece razonable.

enter image description here

p = seq(.01,.1,by=.01); z = qnorm(p)
plot(z, p, ylim=c(0,.1))

2voto

Según recuerdo, fue efectivamente Fisher quien lanzó el 0,05, como sugerencia, y esto se ha tomado como ley en muchos círculos desde entonces. No tengo el libro a mano, pero leí el pasaje una vez, y probablemente se puede encontrar a través de una rápida búsqueda en Google.

No estoy muy familiarizado con la teoría de la decisión, así que no puedo decir definitivamente que Fisher sea la única razón para ello.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X