[Supongamos, por el momento, que no estamos hablando de compuesto hipótesis nula, ya que va a simplificar la discusión a palo para el caso más sencillo. Puntos similares pueden hacerse en el caso de compuesto, sino la resultante de discusión adicional sería probablemente menos esclarecedor]
La probabilidad de un error tipo I, que (si los supuestos hold) está dado por $\alpha$ es la probabilidad de acuerdo con la noción de muestreo repetido. Si se recogen los datos muchas veces cuando la nula es verdadera, a la larga, una proporción de $\alpha$ de esas veces que iba a rechazar. En efecto, se dice que la probabilidad de un error Tipo I antes de probar.
El p-valor es específico de la instancia y condicional. No , no digo que la probabilidad de un error tipo I, ya sea antes de la muestra (no se puede decir que, ya que depende de la muestra), o después de:
Si $p\geq\alpha$, entonces la probabilidad de que hizo un error de Tipo I es cero.
Si la nula es verdadera y $p<\alpha$, entonces la probabilidad de que hizo un error de Tipo I es 1.
Echar otro vistazo a las dos cosas en discusión:
P(error Tipo I) = P(rechazar H$_0$|% H $_0$ verdadero)
p-valor = P(muestra el resultado al menos tan extremo como el observado valor de ejemplo|H$_0$ verdadera, de la muestra)
Son cosas distintas.
De edición Que aparece a partir de los comentarios de que es necesario abordar su segundo párrafo en detalle:
El valor de p, parece dar una exacta estimación de la probabilidad de que falsamente rechazar una hipótesis nula verdadera
No es así, como se discutió anteriormente. (Asumí que esto fue suficiente para que el resto de la cuestión discutible.)
α parece ser un valor máximo aceptable de error de Tipo I,
En efecto, sí (aunque, por supuesto, podemos elegir un menor $\alpha$ que el absoluto de la tasa máxima que estaríamos dispuestos a aceptar por una variedad de razones).
mientras que el p es exacta.
De nuevo, no es así; no es equivalente a $\alpha$ en la propuesta de sentido. Como me sugieren, tanto en el numerador y el denominador en la probabilidad condicional difieren de las de la $\alpha$.
Dicho de otra manera parece dar el mínimo α nivel bajo el cual todavía podemos rechazar la nula.
A pesar de mis anteriores salvedades, existe una relación directa (y no necesariamente particularmente interesante) en qué sentido esto es cierto. Tenga en cuenta que $\alpha$ es elegido antes de la prueba, $p$ se observa después, por lo que es necesario el cambio de nuestra situación habitual.
Si planteamos la siguiente hipótesis:
tenemos una colección de hipótesis de los probadores, cada una operando en su propio nivel de significación
cada una de ellas es presentada con el mismo conjunto de datos
a continuación, es el caso de que el valor-p es una línea divisoria entre aquellos evaluadores que rechazan y los que aceptan. En ese sentido, el p-valor es el mínimo α nivel bajo que los probadores todavía podría rechazar la nula. Pero en una real situación de prueba, $\alpha$ es fijo, no variable, y la probabilidad de que estamos tratando es de 0 o 1 (en un cierto sentido similar a la forma en que la gente dice "la probabilidad de que el intervalo de confianza incluye el parámetro").
Nuestra probabilidad de declaraciones se refieren a la toma de muestras repetidas; si postulamos una colección de probadores cada uno con sus propios $\alpha$, y considerar sólo un único conjunto de datos para probar uno, no está claro $\alpha$ es la probabilidad de que cualquier cosa en ese escenario - más bien, $\alpha$ representa algo si tuviéramos una colección de los probadores y la toma de muestras repetidas donde el null es cierto - que tendría que ser el rechazo de una proporción $\alpha$ de sus valores nulos a través de muestras, mientras que $p$ representaría algo acerca de cada muestra.