27 votos

Exacto dos proporciones de muestra prueba binomial en R (y algunos extraños p-valores)

Estoy tratando de resolver la siguiente pregunta:

El jugador a ganado 17 de los 25 juegos mientras que el jugador B ganó 8 de los 20 - es hay una diferencia significativa entre ambas ratios?

Lo que hay que hacer en R que viene a la mente es la siguiente:

> prop.test(c(17,8),c(25,20),correct=FALSE)

    2-sample test for equality of proportions without continuity correction

data:  c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
 -0.002016956  0.562016956
sample estimates:
prop 1 prop 2 
  0.68   0.40 

Para esta prueba, dice que la diferencia no es significativa al 95% de nivel de confianza.

Porque sabemos que prop.test() sólo está utilizando una aproximación quiero hacer las cosas más exacta mediante el uso de un exacto prueba binomial - y puedo hacerlo de ambas maneras alrededor de:

> binom.test(x=17,n=25,p=8/20)

    Exact binomial test

data:  17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
 0.4649993 0.8505046
sample estimates:
probability of success 
                  0.68 

> binom.test(x=8,n=20,p=17/25)

    Exact binomial test

data:  8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
 0.1911901 0.6394574
sample estimates:
probability of success 
                   0.4 

Ahora bien, esto es extraño, ¿no? Los valores de p son totalmente diferente cada vez! En ambos casos los resultados son muy significativos, pero los p-valores parecen saltar de una vez al azar.

Mis preguntas

  1. ¿Por qué son los p-valores que diferente cada vez?
  2. Cómo realizar una exacta dos proporciones de muestra prueba binomial en R correctamente?

36voto

llg179 Puntos 1

Si usted está buscando un 'exacta' test para dos proporciones binomiales, yo creo que usted está buscando para la Prueba Exacta de Fisher. En R se aplica así:

> fisher.test(matrix(c(17, 25-17, 8, 20-8), ncol=2))
    Fisher's Exact Test for Count Data
data:  matrix(c(17, 25 - 17, 8, 20 - 8), ncol = 2)
p-value = 0.07671
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
  0.7990888 13.0020065
sample estimates:
odds ratio 
  3.101466 

El fisher.test función acepta una matriz de objetos de los "éxitos" y "fracasos" de los dos proporciones binomiales. Como se puede ver, sin embargo, las dos caras hipótesis no es todavía significativo, lamento decir. Sin embargo, la prueba Exacta de Fisher es normalmente sólo se aplica cuando el recuento de células es baja (normalmente, esto significa 5 o menos, pero algunos dicen 10), por lo tanto, su uso inicial de prop.test es el más apropiado.

Con respecto a su binom.test llamadas, que son la incomprensión de la llamada. Cuando ejecute binom.test(x=17,n=25,p=8/20) se está probando si la proporción es significativamente diferente a la de una población donde la probabilidad de éxito es 8/20. De la misma manera con binom.test(x=8,n=20,p=17/25) dice que la probabilidad de éxito es 17/25 es por eso que estos valores de p son diferentes. Por lo tanto, usted no es la comparación de dos proporciones.

4voto

Guest1 Puntos 1

Hay una diferencia entre dos muestras y una muestra en comparación a un conocido hipótesis. Así que si alguien tira una moneda 100 veces y se pone jefes 55 veces y la hipótesis es una feria de la moneda, frente a dos personas que lanzar una moneda de las que se desconoce la equidad y la obtención de cabezas de 55 veces y el otro 45 veces. En el primer caso simplemente está tratando de identificar si el flipper parece estar arrojando una moneda buena. En el último, usted está mirando para ver si se están moviendo de un tirón monedas de la misma equidad. Usted puede ver cómo, si usted está buscando en cada jugador contra una probabilidad conocida (45 vs 50 y 55 vs 50) es diferente de una comparación entre otros (45 vs 55).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X