Aunque se puede utilizar el t para comprobar la diferencia de proporciones, el z es un poco más precisa, ya que utiliza una estimación de la desviación estándar formulada específicamente para datos binomiales (es decir, dicotómicos, nominales, etc.). Lo mismo ocurre con el z prueba de equivalencia de proporciones.
En primer lugar, el z La prueba de diferencia de proporciones de dos muestras independientes es bastante sencilla:
Acerca de z pruebas de diferencia de proporción no apareada
La hipótesis nula es $H_{0}\text{: }p_{1} - p_{2} = 0$ (es decir $H_{0}\text{: }p_{1} = p_{2}$ ), con $H_{\text{A}}\text{: }p_{1} - p_{2} \ne 0$ .
$z = \frac{\hat{p}_{1}-\hat{p}_{2}}{\sqrt{\hat{p}\left(1-\hat{p}\right)\left[\frac{1}{n_{1}} + \frac{1}{n_{2}}\right]}}$ ,
donde:
$\hat{p}_{1}$ y $\hat{p}_{1}$ son la muestra proporciones en el grupo 1 y en el grupo 2;
$n_{1}$ y $n_{2}$ son la muestra tallas en el grupo 1 y en el grupo 2; y
$\hat{p}$ es la estimación de las medias muestrales si $H_{0}$ es verdadera, cuya mejor estimación es simplemente la proporción global de la muestra (es decir, de todos los datos, ignorando a qué grupo pertenece una observación).
Puede que quieras considerar un corrección de continuidad . Por ejemplo, la corrección de Hauck y Anderson (1986) da:
$c_{\text{HA}} = \frac{1}{2\min{(n_{1},n_{2})}}$ y una redefinición de $s_{\hat{p}}$ :
$s_{\hat{p}}= \sqrt{ \frac{\hat{p}_{1}(1-\hat{p}_{1})}{n_{1}-1} + \frac{\hat{p}_{2}(1-\hat{p}_{2})}{n_{2}-1}}$ para que
$z = \frac{\left|\hat{p}_{1} - \hat{p}_{2}\right| - c_{\text{HA}}}{\sqrt{ \frac{\hat{p}_{1}(1-\hat{p}_{1})}{n_{1}-1} + \frac{\hat{p}_{2}(1-\hat{p}_{2})}{n_{2}-1}}}$
Lo apropiado $p$ -valor para esto $z$ -la estadística se calcula o se busca en una tabla, y se compara con $\alpha/2$ (prueba de dos colas).
Acerca de z pruebas de equivalencia de proporciones no apareadas
Porque todo diferencias son "estadísticamente significativas" dado un tamaño de muestra suficientemente grande, es una buena idea decidir de antemano lo que el más pequeño relevante diferencia en las proporciones es para ti, y luego busca pruebas de tal relevancia. Encontrará dichas pruebas mediante combinar las inferencias de la prueba de la diferencia que acabamos de describir, con una prueba de equivalencia .
Supongamos que usted decide de antemano que una diferencia significativa en la proporción para sus propósitos está en que es al menos 0,05 (es decir. $|p_{1} - p_{2}| \ge 0.05$ ), entonces la prueba correspondiente de equivalencia de proporciones para dos grupos independientes es:
$H^{-}_{0}\text{: }|p_{1} - p_{2}| \ge 0.05$ lo que se traduce en dos hipótesis nulas unilaterales:
-
$H^{-}_{01}\text{: }p_{1} - p_{2} \ge 0.05$
-
$H^{-}_{02}\text{: }p_{1} - p_{2} \le -0.05$
Estas dos hipótesis nulas unilaterales pueden probarse con (estos estadísticos de prueba se han construido ambos para pruebas unilaterales de cola superior):
-
$z_{1} = \frac{0.05 - \left(\hat{p}_{1}-\hat{p}_{2}\right)}{\sqrt{\hat{p}\left(1-\hat{p}\right)\left[\frac{1}{n_{1}} + \frac{1}{n_{2}}\right]}}$ y
-
$z_{2} = \frac{\left(\hat{p}_{1}-\hat{p}_{2}\right)+0.05}{\sqrt{\hat{p}\left(1-\hat{p}\right)\left[\frac{1}{n_{1}} + \frac{1}{n_{2}}\right]}}$ .
Con una corrección de continuidad $z_{1}$ y $z_{2}$ en su lugar (véase Tu, 1997):
-
$z_{1} = \frac{0.05 - \left(\hat{p}_{1}-\hat{p}_{2}\right) + c_{\text{HA}}}{\sqrt{ \frac{\hat{p}_{1}(1-\hat{p}_{1})}{n_{1}-1} + \frac{\hat{p}_{2}(1-\hat{p}_{2})}{n_{2}-1}}}$ y
-
$z_{2} = \frac{\left(\hat{p}_{1}-\hat{p}_{2}\right)+0.05-c_{\text{HA}}}{\sqrt{ \frac{\hat{p}_{1}(1-\hat{p}_{1})}{n_{1}-1} + \frac{\hat{p}_{2}(1-\hat{p}_{2})}{n_{2}-1}}}$ .
Si rechaza ambos $H^{-}_{01}$ y $H^{-}_{02}$ (ambos probados en $\alpha$ no $\alpha/2$ y ambos probados con cola derecha regiones de rechazo), entonces puede concluir que tiene pruebas de equivalencia.
Acerca de pruebas de relevancia
Finalmente ... si se combina la inferencia de las pruebas de $H_{0}$ y $H^{-}_{0}$ (es decir, prueba de la diferencia y prueba de la equivalencia), entonces se obtiene una de las siguientes posibilidades:
-
rechazar $H_{0}$ y rechazar $H^{-}_{0}$ : concluir diferencia trivial entre proporciones (es decir, sí hay una diferencia, pero es demasiado pequeña para que te importe porque es menor que 0,05);
-
rechazar $H_{0}$ y no rechazar $H^{-}_{0}$ : concluir diferencia relevante entre proporciones (es decir, mayor que 0,05);
-
no rechazar $H_{0}$ y rechazar $H^{-}_{0}$ : concluir equivalencia de proporciones; o
-
no rechazar $H_{0}$ y no rechazar $H^{-}_{0}$ : concluir indeterminado (es decir, pruebas con poca potencia).
Código R
Primero la prueba de la diferencia:
Supongamos que g1
y g2
son vectores que contienen los datos binomiales del grupo 1 y del grupo 2 respectivamente.
n1 <- length(g1) #sample size group 1
n2 <- length(g2) #sample size group 2
p1 <- sum(g1)/n1 #p1 hat
p2 <- sum(g2)/n2 #p2 hat
n <- n1 + n2 #overall sample size
p <- sum(g1,g2)/n #p hat
cHA <- 1/(2*min(n1,n2))
# without continuity correction
z <- (p1 - p2)/sqrt(p*(1-p)*(1/n1 + 1/n2)) #test statistic
pval <- 1 - pnorm(abs(z)) #p-value reject H0 if it is <= alpha/2 (two-tailed)
# with continuity correction
zHA <- (abs(p1 - p2) - cHA)/sqrt((p1*(1-p1)/(n1-1)) + (p2*(1-p2)/(n2-1))) #with continuity correction
pvalHA <- 1 - pnorm(abs(zHA)) #p-value reject H0 if it is <= alpha/2 (two-tailed)
A continuación, la prueba de equivalencia:
Delta <- 0.05 #Equivalence threshold of +/- 5%.
# You will want to carefully think about and select your own
# value for Delta before you conduct your test.
De nuevo, asuma que g1
y g2
son vectores que contienen los datos binomiales del grupo 1 y del grupo 2 respectivamente.
n1 <- length(g1) #sample size group 1
n2 <- length(g2) #sample size group 2
p1 <- sum(g1)/n1 #p1 hat
p2 <- sum(g2)/n2 #p2 hat
n <- n1 + n2 #overall sample size
p <- sum(g1,g2)/n #p hat
cHAeq <- sign(p1-p2)* (1/(2*min(n1,n2)))
# without continuity correction
z1 <- (Delta - (p1 - p2))/sqrt(p*(1-p)*(1/n1 + 1/n2)) #test statistic for H01
z2 <- ((p1 - p2) + Delta)/sqrt(p*(1-p)*(1/n1 + 1/n2)) #test statistic for H02
pval1 <- 1 - pnorm(z1) #p-value (upper tail) reject H0 if it is <= alpha (one tail)
pval2 <- 1 - pnorm(z2) #p-value (upper tail) reject H0 if it is <= alpha (one tail)
# with continuity correction
zHA1 <- (Delta - abs(p1 - p2) + cHAeq)/sqrt((p1*(1-p1)/(n1-1)) + (p2*(1-p2)/(n2-1))) #with continuity correction
zHA2 <- (abs(p1 - p2) + Delta - cHAeq)/sqrt((p1*(1-p1)/(n1-1)) + (p2*(1-p2)/(n2-1))) #with continuity correction
pvalHA1 <- 1 - pnorm(zHA1) #p-value (upper tail) reject H0 if it is <= alpha (one tail)
pvalHA2 <- 1 - pnorm(zHA2) #p-value (upper tail) reject H0 if it is <= alpha (one tail)
Referencias
Hauck, W. W. y Anderson, S. (1986). Una comparación de los métodos de intervalos de confianza de grandes muestras para la diferencia de dos probabilidades binomiales . El Estadístico Americano , 40(4):318-322.
Tu, D. (1997). Dos procedimientos de pruebas unilaterales para establecer la equivalencia terapéutica con criterios de valoración clínicos binarios: rendimientos de muestras fijas y determinación del tamaño de la muestra . Revista de Cálculo y Simulación Estadística , 59(3):271-290.
0 votos
¿Puede mostrar la salida de
tost
? ¿Y dar el número de éxitos para G2? ¿Está probando $H_0: p_1 = p_2$ vs $H_a: p_1 \ne p_2?$ No está claro si se trata principalmente de cómo utilizartost
o principalmente sobre la comprobación de una hipótesis.