4 votos

Valor P e intervalo de confianza para la prueba de dos muestras de proporciones en desacuerdo

Estoy utilizando R para calcular la prueba de dos muestras para la igualdad de proporciones, donde las dos proporciones son 350/400 y 25/25. Entonces:

> prop.test(c(350,25),c(400,25))                                                                                                                                                           

        2-sample test for equality of proportions with continuity correction

data:  c(350, 25) out of c(400, 25) 
X-squared = 2.4399, df = 1, p-value = 0.1183
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.17865986 -0.07134014 
sample estimates:
prop 1 prop 2 
 0.875  1.000 

Warning message:
In prop.test(c(350, 25), c(400, 25), correct = FALSE) :
  Chi-squared approximation may be incorrect

Lo que no puedo conciliar por mí mismo es que el valor p sea superior a 0,05 y, sin embargo, el intervalo de confianza del 95% para la diferencia no incluya 0. Pensaba que había una relación "si y sólo si" entre ambos (El valor p < alfa si el intervalo de confianza (1-alfa) de la diferencia no incluye 0).

¿Qué es lo que no veo? Mi única suposición es que hay algo fundamental que estoy entendiendo mal, o que tiene algo que ver con ese mensaje de advertencia sobre la aproximación chi-cuadrado.

8voto

AdamSane Puntos 1825

Supongo que en este caso son el resultado de dos aproximaciones algo diferentes.

Para la prueba chi-cuadrado ordinaria, el intervalo que corresponde al chi-cuadrado es el Intervalo de puntuación de Wilson

$$\frac{1}{1 + \frac{1}{n} z_{1 - \frac{1}{2}\alpha}^2} \left[ \hat p + \frac{1}{2n} z_{1 - \frac{1}{2}\alpha}^2 \pm z_{1 - \frac{1}{2}\alpha} \sqrt{ \frac{1}{n}\hat p \left(1 - \hat p\right) + \frac{1}{4n^2}z_{1 - \frac{1}{2}\alpha}^2 } \right]$$

Buscando en el código (basta con escribir prop.test para ver el código correspondiente), parece que se obtiene el intervalo de puntuación de Wilson por defecto, pero con una corrección de continuidad aplicada a $p$ .

[Tenga en cuenta que una de las referencias de la ayuda ( ?prop.test ) debate once diferentes intervalos de confianza para la diferencia de proporciones; como máximo siempre corresponderá exactamente a cualquier forma dada de la prueba de hipótesis].

Mientras que el intervalo de puntuación de Wilson sin corrección de continuidad corresponderá al chi-cuadrado sin corrección de continuidad, mi suposición es que la versión con corrección de continuidad de ambos que se está utilizando ya no se corresponde exactamente.

Supongo que la forma de obtener un intervalo que debería corresponder sería escribir el intervalo correspondiente al chi-cuadrado corregido por continuidad de forma similar a como se obtiene el intervalo de puntuación de Wilson (véase el enlace de Wikipedia anterior) y resolverlo para los puntos finales.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X