Estoy probando igualdad de dos proporciones binomiales 87/88 y 48/60. Utilizo esta calculadora en línea y noté que la aproximación Normal Estándar no es válida en este caso. Me parece bastante extraño. ¿Es un problema probar la igualdad de dos proporciones binomiales si una de las proporciones está muy cerca del 100%?
Respuestas
¿Demasiados anuncios?Si usted confía en wikipedia para reglas de oro para la validez de la aproximación normal de la distribución binomial:
Una regla general es que ambos $np$ $n(1−p)$ debe ser mayor que $5$. Sin embargo, el número específico varía de una fuente a fuente, y que depende de sobre cómo una buena aproximación de lo que uno quiere; algunas fuentes dan a $10$ que da prácticamente los mismos resultados como la siguiente regla para la gran "n" hasta "n" es muy grande (por ejemplo: "x=11, n=7752").
Una segunda regla es que para $n > 5$ la aproximación normal es adecuado si
$$\left|(1/\sqrt{n})(\sqrt{(1-p)/p}-\sqrt{p/(1-p)})\right|<0.3$$
- Otro de los que comúnmente se utiliza la regla sostiene que la aproximación normal es apropiada sólo si todo dentro de 3 desviaciones estándar de su significa que está dentro del rango de valores posibles es que si
$$ \mu \pm 3 \sigma = np \pm 3 \sqrt{np(1-p)} \in [0,n]. \,$$
Todos aquellos que fallan al $p$ está cerca de a $0$ o $1$. La idea intuitiva es que, a continuación, la distribución es:
- muy sesgada, y
- la aproximación normal será demasiado importante fuera de los propios límites de la distribución binomial, $[0, n]$.
+1 para @Jaime. Pero como sucede en este caso la hipótesis nula es que las dos proporciones iguales de un conjunto de la figura de (87+48)/(88+60) = 0.91. Con el tamaño de la muestra de esto es aceptable en el área de aproximaciones como esta la prueba z o el equivalente a la prueba de la chi cuadrado. Ver que los valores de la "espera" (en el sentido esperado bajo la hipótesis nula de igualdad de proporciones) de la matriz a continuación son más de 5, que normalmente se acepta como una buena regla del pulgar.
Yo estaría a favor de una solución sencilla una prueba de la Chi cuadrado con corrección de continuidad - que está de acuerdo con usted (bajo valor de p) que es poco probable que un fondo común proporción producir estos dos observado conjuntos de datos.
> p <- (87+48)/(88+60)
> p
[1] 0.9121622
> obs <- matrix(c(87,1,48,12), nrow=2)
> obs
[,1] [,2]
[1,] 87 48
[2,] 1 12
> expected <- rbind(p * margin.table(obs,2),(1-p) * margin.table(obs,2))
> expected
[,1] [,2]
[1,] 80.27027 54.72973
[2,] 7.72973 5.27027
> chisq.test(obs)
Pearson's Chi-squared test with Yates' continuity correction
data: obs
X-squared = 13.5773, df = 1, p-value = 0.0002289