Loading [MathJax]/extensions/TeX/mathchoice.js

5 votos

Una pregunta elemental sobre la prueba binomial: ¿por qué debo tomar una suma?

Realicé un experimento para comparar dos programas informáticos de reversi, a saber A y B en el que les hice jugar entre ellos 50 veces y A ganó B 31 veces.

Ahora me gustaría probar si A es más fuerte que B es decir, la probabilidad p de A ganador B (ni empatar ni perder) es mayor que 1/2, con nivel de significación α . Según Artículo de Wikipedia sobre la prueba binomial puedo calcular \frac{\binom{50}{31}+\dots+\binom{50}{50}}{2^{50}} y compárelo con \alpha .

Lo que no veo es por qué debería tomar una suma y considerar la probabilidad de ganar 31, 32, ... o 50 veces. Si estuviera tratando con una variable aleatoria continua, seguramente tendría sentido tomar una suma (es decir, integrar) para obtener la probabilidad a partir de la densidad de probabilidad, porque no existe la probabilidad de que la variable coincida exactamente con el valor observado. Pero estoy tratando con una variable discreta y puedo calcular la probabilidad de ganar exactamente 31 veces.

Entonces, ¿por qué debo tomar una suma (o realmente tengo que tomar una suma)?

EDIT: He corregido mis errores y aclarado mi pregunta.

2voto

matt Puntos 11

El comentario de Max responde a tu pregunta: La definición de la p -valor es la probabilidad de obtener un valor como mínimo como extremo, y esto incluye todos los resultados más asimétricos que el que usted observó. Usted decide si considera 10-40 más desigual que 31-19 si desea utilizar una prueba de dos colas o de una cola, pero debe incluir 40-10 .

Si olvida incluir los términos más asimétricos, calculará una probabilidad pequeña y rechazará automáticamente la hipótesis nula cuando utilice un gran número de ensayos. Si juega 1 millones de partidas entre oponentes iguales, el resultado más probable es un empate, y la probabilidad de que eso ocurra sigue siendo bastante pequeña. {1,000,000 \choose 500,000}/2^{1,000,000} \approx 1/(500\sqrt{2\pi}) \approx 0.000798 \lt 0.1\%. Cada puntuación tiene menos de un 0.1\% ¡oportunidad de que ocurra! Por lo tanto, si no se añaden resultados más extremos, simplemente se confirmaría que se ha producido algún acontecimiento improbable simplemente porque hay muchas posibilidades cuando se tiene 1,000,000 juegos. Si observa una puntuación de 500,300-499,700 la posibilidad real de ver un marcador al menos igual de desigual a favor de A cuando A y B son iguales es 27.46\% y la probabilidad de un resultado al menos igual de desigual a favor de uno u otro jugador es el doble, sobre 50\% .

Es razonable preguntarse por qué el p -valor se define así. Whuber insinuó que el lema Neyman-Pearson es relevante. Otra forma de pensar en ello es que sólo queremos tener una oportunidad \alpha rechazar la hipótesis nula si la hipótesis nula es cierta. Si tenemos una ordenación lineal de lo extremos que son los resultados, y definimos la p -como la probabilidad de obtener un resultado al menos igual de extremo, entonces el caso de que obtengamos un resultado con p -valor inferior a \alpha tiene una probabilidad menor que \alpha .

En diferentes procedimientos estadísticos, hay ocasiones en las que se calculan sólo las probabilidades de determinados resultados, como una actualización bayesiana de una distribución a priori. Se trata de 4 veces más probabilidades de 31-19 resultado si A es en realidad un 60-40 favorito en lugar de par, por lo que reforzaría su estimación de la probabilidad de que A es un 60-40 favorito por un factor de 4 en relación con la probabilidad de que A y B son pares, no la relación entre las probabilidades de observar sucesos al menos igual de extremos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X