6 votos

Prueba de equivalencia para datos binominales

Quiero aplicar una prueba de equivalencia a mi muestra para inferir si son equivalentes o no.

Como mis datos son bionominales [0,1] no sé si el procedimiento TOST (tost() en R) puede manejar mi problema o no.

Mis datos constan de dos grupos (G1 y G2) que no son iguales en número de muestras. Por ejemplo, G1= 164 personas y G2=280 personas. Las muestras son binominales, de manera que G1 incluye el número de personas que terminaron y fracasaron en completar un juego "en nuestro caso de estudio", y se especifica con 1 y 0, respectivamente. Por ejemplo, G1 incluye a 55 jugadores que pudieron terminar la partida y el resto la falló. Lo mismo para G2 con números diferentes. Mi pregunta es, ¿cuál es la mejor prueba de equivalencia para este tipo de datos para inferir si son equivalentes? He implementado el test tost() en r y he obtenido el resultado, pero no estoy seguro de que el test sea correcto, ya que la función calcula automáticamente la media y la DE. Por ejemplo, tost() calcula la media para el ejemplo anterior G1, m= 0,35, pero, cuando calculo la media siguiendo la fórmula n*p(0,5), obtuve m=82.

El número de aciertos en G1 es 58 de 164, y para G2 es 113 de 280. Aquí está mi código:

    equivalence::tost(G1,G2,paired = FALSE, epsilon=0.15, var.equal=FALSE,conf.level = 0.95, alpha = 0.05)

Y este es el resultado que obtuve:

    Welch Two Sample TOST

    data:  G1 and G2
    df = 348.24
    sample estimates:
    mean of G1 mean of G2 
    0.3536585 0.4035714 

    Epsilon: 0.15 
    95 percent two one-sided confidence interval (TOST interval):
        -0.12840509  0.02857931
    Null hypothesis of statistical difference is: rejected 
    TOST p-value: 0.01809221

0 votos

¿Puede mostrar la salida de tost ? ¿Y dar el número de éxitos para G2? ¿Está probando $H_0: p_1 = p_2$ vs $H_a: p_1 \ne p_2?$ No está claro si se trata principalmente de cómo utilizar tost o principalmente sobre la comprobación de una hipótesis.

10voto

GenericTypeTea Puntos 27689

Aunque se puede utilizar el t para comprobar la diferencia de proporciones, el z es un poco más precisa, ya que utiliza una estimación de la desviación estándar formulada específicamente para datos binomiales (es decir, dicotómicos, nominales, etc.). Lo mismo ocurre con el z prueba de equivalencia de proporciones.

En primer lugar, el z La prueba de diferencia de proporciones de dos muestras independientes es bastante sencilla:

Acerca de z pruebas de diferencia de proporción no apareada
La hipótesis nula es $H_{0}\text{: }p_{1} - p_{2} = 0$ (es decir $H_{0}\text{: }p_{1} = p_{2}$ ), con $H_{\text{A}}\text{: }p_{1} - p_{2} \ne 0$ .

$z = \frac{\hat{p}_{1}-\hat{p}_{2}}{\sqrt{\hat{p}\left(1-\hat{p}\right)\left[\frac{1}{n_{1}} + \frac{1}{n_{2}}\right]}}$ ,
donde:
$\hat{p}_{1}$ y $\hat{p}_{1}$ son la muestra proporciones en el grupo 1 y en el grupo 2;
$n_{1}$ y $n_{2}$ son la muestra tallas en el grupo 1 y en el grupo 2; y
$\hat{p}$ es la estimación de las medias muestrales si $H_{0}$ es verdadera, cuya mejor estimación es simplemente la proporción global de la muestra (es decir, de todos los datos, ignorando a qué grupo pertenece una observación).

Puede que quieras considerar un corrección de continuidad . Por ejemplo, la corrección de Hauck y Anderson (1986) da:

$c_{\text{HA}} = \frac{1}{2\min{(n_{1},n_{2})}}$ y una redefinición de $s_{\hat{p}}$ :

$s_{\hat{p}}= \sqrt{ \frac{\hat{p}_{1}(1-\hat{p}_{1})}{n_{1}-1} + \frac{\hat{p}_{2}(1-\hat{p}_{2})}{n_{2}-1}}$ para que

$z = \frac{\left|\hat{p}_{1} - \hat{p}_{2}\right| - c_{\text{HA}}}{\sqrt{ \frac{\hat{p}_{1}(1-\hat{p}_{1})}{n_{1}-1} + \frac{\hat{p}_{2}(1-\hat{p}_{2})}{n_{2}-1}}}$

Lo apropiado $p$ -valor para esto $z$ -la estadística se calcula o se busca en una tabla, y se compara con $\alpha/2$ (prueba de dos colas).

Acerca de z pruebas de equivalencia de proporciones no apareadas
Porque todo diferencias son "estadísticamente significativas" dado un tamaño de muestra suficientemente grande, es una buena idea decidir de antemano lo que el más pequeño relevante diferencia en las proporciones es para ti, y luego busca pruebas de tal relevancia. Encontrará dichas pruebas mediante combinar las inferencias de la prueba de la diferencia que acabamos de describir, con una prueba de equivalencia .

Supongamos que usted decide de antemano que una diferencia significativa en la proporción para sus propósitos está en que es al menos 0,05 (es decir. $|p_{1} - p_{2}| \ge 0.05$ ), entonces la prueba correspondiente de equivalencia de proporciones para dos grupos independientes es:

$H^{-}_{0}\text{: }|p_{1} - p_{2}| \ge 0.05$ lo que se traduce en dos hipótesis nulas unilaterales:

  1. $H^{-}_{01}\text{: }p_{1} - p_{2} \ge 0.05$

  2. $H^{-}_{02}\text{: }p_{1} - p_{2} \le -0.05$

Estas dos hipótesis nulas unilaterales pueden probarse con (estos estadísticos de prueba se han construido ambos para pruebas unilaterales de cola superior):

  1. $z_{1} = \frac{0.05 - \left(\hat{p}_{1}-\hat{p}_{2}\right)}{\sqrt{\hat{p}\left(1-\hat{p}\right)\left[\frac{1}{n_{1}} + \frac{1}{n_{2}}\right]}}$ y

  2. $z_{2} = \frac{\left(\hat{p}_{1}-\hat{p}_{2}\right)+0.05}{\sqrt{\hat{p}\left(1-\hat{p}\right)\left[\frac{1}{n_{1}} + \frac{1}{n_{2}}\right]}}$ .

Con una corrección de continuidad $z_{1}$ y $z_{2}$ en su lugar (véase Tu, 1997):

  1. $z_{1} = \frac{0.05 - \left(\hat{p}_{1}-\hat{p}_{2}\right) + c_{\text{HA}}}{\sqrt{ \frac{\hat{p}_{1}(1-\hat{p}_{1})}{n_{1}-1} + \frac{\hat{p}_{2}(1-\hat{p}_{2})}{n_{2}-1}}}$ y

  2. $z_{2} = \frac{\left(\hat{p}_{1}-\hat{p}_{2}\right)+0.05-c_{\text{HA}}}{\sqrt{ \frac{\hat{p}_{1}(1-\hat{p}_{1})}{n_{1}-1} + \frac{\hat{p}_{2}(1-\hat{p}_{2})}{n_{2}-1}}}$ .

Si rechaza ambos $H^{-}_{01}$ y $H^{-}_{02}$ (ambos probados en $\alpha$ no $\alpha/2$ y ambos probados con cola derecha regiones de rechazo), entonces puede concluir que tiene pruebas de equivalencia.

Acerca de pruebas de relevancia
Finalmente ... si se combina la inferencia de las pruebas de $H_{0}$ y $H^{-}_{0}$ (es decir, prueba de la diferencia y prueba de la equivalencia), entonces se obtiene una de las siguientes posibilidades:

  1. rechazar $H_{0}$ y rechazar $H^{-}_{0}$ : concluir diferencia trivial entre proporciones (es decir, sí hay una diferencia, pero es demasiado pequeña para que te importe porque es menor que 0,05);

  2. rechazar $H_{0}$ y no rechazar $H^{-}_{0}$ : concluir diferencia relevante entre proporciones (es decir, mayor que 0,05);

  3. no rechazar $H_{0}$ y rechazar $H^{-}_{0}$ : concluir equivalencia de proporciones; o

  4. no rechazar $H_{0}$ y no rechazar $H^{-}_{0}$ : concluir indeterminado (es decir, pruebas con poca potencia).

Código R

Primero la prueba de la diferencia:

Supongamos que g1 y g2 son vectores que contienen los datos binomiales del grupo 1 y del grupo 2 respectivamente.

n1 <- length(g1) #sample size group 1
n2 <- length(g2) #sample size group 2
p1 <- sum(g1)/n1 #p1 hat
p2 <- sum(g2)/n2 #p2 hat
n <- n1 + n2 #overall sample size
p <- sum(g1,g2)/n #p hat
cHA <- 1/(2*min(n1,n2))

# without continuity correction
z <- (p1 - p2)/sqrt(p*(1-p)*(1/n1 + 1/n2)) #test statistic
pval <- 1 - pnorm(abs(z)) #p-value reject H0 if it is <= alpha/2 (two-tailed)

# with continuity correction
zHA <- (abs(p1 - p2) - cHA)/sqrt((p1*(1-p1)/(n1-1)) + (p2*(1-p2)/(n2-1))) #with continuity correction
pvalHA <- 1 - pnorm(abs(zHA)) #p-value reject H0 if it is <= alpha/2 (two-tailed)

A continuación, la prueba de equivalencia:

Delta <- 0.05 #Equivalence threshold of +/- 5%.
# You will want to carefully think about and select your own
# value for Delta before you conduct your test.

De nuevo, asuma que g1 y g2 son vectores que contienen los datos binomiales del grupo 1 y del grupo 2 respectivamente.

n1 <- length(g1) #sample size group 1
n2 <- length(g2) #sample size group 2
p1 <- sum(g1)/n1 #p1 hat
p2 <- sum(g2)/n2 #p2 hat
n <- n1 + n2 #overall sample size
p <- sum(g1,g2)/n #p hat
cHAeq <- sign(p1-p2)* (1/(2*min(n1,n2)))

# without continuity correction
z1 <- (Delta - (p1 - p2))/sqrt(p*(1-p)*(1/n1 + 1/n2)) #test statistic for H01
z2 <- ((p1 - p2) + Delta)/sqrt(p*(1-p)*(1/n1 + 1/n2)) #test statistic for H02
pval1 <- 1 - pnorm(z1) #p-value (upper tail) reject H0 if it is <= alpha (one tail)
pval2 <- 1 - pnorm(z2) #p-value (upper tail) reject H0 if it is <= alpha (one tail)

# with continuity correction
zHA1 <- (Delta - abs(p1 - p2) + cHAeq)/sqrt((p1*(1-p1)/(n1-1)) + (p2*(1-p2)/(n2-1))) #with continuity correction
zHA2 <- (abs(p1 - p2) + Delta - cHAeq)/sqrt((p1*(1-p1)/(n1-1)) + (p2*(1-p2)/(n2-1))) #with continuity correction
pvalHA1 <- 1 - pnorm(zHA1) #p-value (upper tail) reject H0 if it is <= alpha (one tail)
pvalHA2 <- 1 - pnorm(zHA2) #p-value (upper tail) reject H0 if it is <= alpha (one tail)

Referencias

Hauck, W. W. y Anderson, S. (1986). Una comparación de los métodos de intervalos de confianza de grandes muestras para la diferencia de dos probabilidades binomiales . El Estadístico Americano , 40(4):318-322.

Tu, D. (1997). Dos procedimientos de pruebas unilaterales para establecer la equivalencia terapéutica con criterios de valoración clínicos binarios: rendimientos de muestras fijas y determinación del tamaño de la muestra . Revista de Cálculo y Simulación Estadística , 59(3):271-290.

1 votos

Gracias por el código y la buena explicación. Tengo que considerar mi caso como "con corrección de continuidad" o "sin corrección de continuidad"? Aunque "con corrección de continuidad" la fórmula no funciona en mi caso, ya que esta línea (p1*(1-p1)/n1-1) + (p2*(1-p2)/n2-1)" proporciona un resultado negativo y $sqrt$ ¡no funciona!

0 votos

@nahidkhosh ¡Ups! ¡El orden de las operaciones me ha pillado! Debería estar arreglado ahora con el par de paréntesis añadido. Porque estás usando un $\alpha=0.05$ , tienen $p_{1}$ & $p_{2}$ que no sean demasiado extremas, y que tengan una $\Delta$ En el caso de que la muestra sea de un tamaño lo suficientemente grande como para que la corrección de continuidad de Hauck-Anderson no suponga una gran diferencia. (Aunque $\Delta=0.15$ es enorme en mi opinión... eso es como decir que 0,2 es equivalente a 0,05... pero eso es cosa tuya, no mía. :)

0 votos

¡Gran respuesta! Me pregunto si existe un paquete en R para ello.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X