4 votos

Absoluta (es decir, no sólo relativa) de las probabilidades en la prueba de chi-cuadrado para proporciones

¿Por qué la absoluta probabilidades de afectar el valor de p de una prueba de chi-cuadrado tanto? Por ejemplo:

> successes.1 = c(400, 500)
> successes.2 = c(40, 50)
> trials = c(1000, 1000)
> test.1 = prop.test(successes.1, trials)
> test.2 = prop.test(successes.2, trials)
> test.1

    2-sample test for equality of proportions with continuity correction

data:  successes.1 out of trials
X-squared = 19.8, df = 1, p-value = 8.598e-06
alternative hypothesis: two.sided
95 percent confidence interval:
 -0.14438565226 -0.05561434774
sample estimates:
prop 1 prop 2 
   0.4    0.5 

> test.2

    2-sample test for equality of proportions with continuity correction

data:  successes.2 out of trials
X-squared = 0.9424, df = 1, p-value = 0.3317
alternative hypothesis: two.sided
95 percent confidence interval:
 -0.029165387766  0.009165387766
sample estimates:
prop 1 prop 2 
  0.04   0.05 

3voto

Sean Hanley Puntos 2428

Los datos se distribuyen de un binomio. La varianza de un binomio es una función de la media y/o la probabilidad de éxito (que es la misma cosa). Específicamente, la varianza es:
$$ {\rm Var}(X) = Np(1-p) $$ donde $p$ el (absoluta) probabilidad de éxito. Debido a que las probabilidades difieren entre los dos ejemplos, el error estándar de la $\hat p$ diferencia. Y por lo tanto la potencia estadística / la $p$-valor de la prueba es diferente.

3voto

AdamSane Puntos 1825

Considere la posibilidad de la varianza de un binomio proporción - $\text{Var}\hat p = p(1-p)/n$. Esto es debido a que $\hat p = x/n$ donde $x$ es el observado contar, que bajo un modelo binomial tiene varianza $np(1-p)$. Propiedades básicas de la varianza significa que la varianza de la muestra proporción que la varianza dividido por $n^2$.

Esto significa que el error estándar de la proporción es $\sqrt{p(1-p)/n}$.

Al $p$ es cerca de $\frac{_1}{^2}$, esto es acerca de la $0.5/\sqrt{n}$. Con $n=1000$, que es aproximadamente la 0.0158

Al $p$ es muy pequeña, se trata de $\sqrt{p}/\sqrt{n}$. Así que si $p$ es cerca de 0.05, el error estándar es de 0,007 - mucho más pequeño, un poco menos de la mitad del tamaño.

Pero aviso que la diferencia de proporciones es una décima parte tan grande (hemos pasado de 0.5 - 0.4 = 0.1 a 0.01). Como una fracción de la diferencia entre las proporciones, los errores estándar son relativamente grandes.

Aquí está una parcela con las proporciones en la escala logarítmica (así, la relativa cambio en la proporción es del mismo tamaño), con los extremos de un 95% de intervalo para cada proporción dibujado en:

enter image description here

En el primer caso, las dos proporciones son algunas distancia (en términos de los errores estándar) aparte* mientras que en el segundo caso las dos proporciones son no - la superposición es sustancial.

* Soy una glosa sobre algunas cuestiones - por ejemplo, es realmente el error estándar de la diferencia en la proporción que importa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X