El comentario de Max responde a tu pregunta: La definición de la p -valor es la probabilidad de obtener un valor como mínimo como extremo, y esto incluye todos los resultados más asimétricos que el que usted observó. Usted decide si considera 10-40 más desigual que 31-19 si desea utilizar una prueba de dos colas o de una cola, pero debe incluir 40-10 .
Si olvida incluir los términos más asimétricos, calculará una probabilidad pequeña y rechazará automáticamente la hipótesis nula cuando utilice un gran número de ensayos. Si juega 1 millones de partidas entre oponentes iguales, el resultado más probable es un empate, y la probabilidad de que eso ocurra sigue siendo bastante pequeña. {1,000,000 \choose 500,000}/2^{1,000,000} \approx 1/(500\sqrt{2\pi}) \approx 0.000798 \lt 0.1\%. Cada puntuación tiene menos de un 0.1\% ¡oportunidad de que ocurra! Por lo tanto, si no se añaden resultados más extremos, simplemente se confirmaría que se ha producido algún acontecimiento improbable simplemente porque hay muchas posibilidades cuando se tiene 1,000,000 juegos. Si observa una puntuación de 500,300-499,700 la posibilidad real de ver un marcador al menos igual de desigual a favor de A cuando A y B son iguales es 27.46\% y la probabilidad de un resultado al menos igual de desigual a favor de uno u otro jugador es el doble, sobre 50\% .
Es razonable preguntarse por qué el p -valor se define así. Whuber insinuó que el lema Neyman-Pearson es relevante. Otra forma de pensar en ello es que sólo queremos tener una oportunidad \alpha rechazar la hipótesis nula si la hipótesis nula es cierta. Si tenemos una ordenación lineal de lo extremos que son los resultados, y definimos la p -como la probabilidad de obtener un resultado al menos igual de extremo, entonces el caso de que obtengamos un resultado con p -valor inferior a \alpha tiene una probabilidad menor que \alpha .
En diferentes procedimientos estadísticos, hay ocasiones en las que se calculan sólo las probabilidades de determinados resultados, como una actualización bayesiana de una distribución a priori. Se trata de 4 veces más probabilidades de 31-19 resultado si A es en realidad un 60-40 favorito en lugar de par, por lo que reforzaría su estimación de la probabilidad de que A es un 60-40 favorito por un factor de 4 en relación con la probabilidad de que A y B son pares, no la relación entre las probabilidades de observar sucesos al menos igual de extremos.