12 votos

¿Que la prueba para comparar proporciones entre 3 grupos?

Estamos probando una campaña e-mailing marketing. En la prueba inicial, envían dos tipos de correo electrónico diferentes y tenía un tercer grupo control que no recibió un correo electrónico. Ahora nos estamos volviendo "resultados" como parte de los usuarios que de volver a nuestra aplicación. Aquí están los resultados:

Group | received e-mail | returned | %-returned
A | 16,895 | 934 | 5.53%
B | 17,530 | 717 | 4.09%
C | 42408 | 1618 | 3.82%

Parece que el grupo A puede ser mejor que B y C, pero ¿qué es la prueba adecuada para mostrar esto?

4voto

rice Puntos 739

En una tabla como esta se puede partición de la G-estadística producida por un G-test, en lugar de calcular las sales de rehidratación oral o mediante la ejecución de una regresión logística. Aunque usted tiene que decidir cómo va a partición. Aquí, el G-estadística, que es similar a la de Pearson X^2 y también sigue un X^2 distribución es la siguiente:

G = 2 * sum(OBS * ln(OBS/EXP)).

Primero se calcula que para el total de la tabla, en este caso: G = 76.42, el 2 de df, que es altamente significativa (p < 0.0001). Es decir que la tasa de retorno depende del grupo (a, B o C).

Luego, debido a que tiene 2 df, puede realizar dos pequeños 1 df (2x2) G-test. Después de realizar la primera, sin embargo, usted tiene que colapsar las filas de los dos niveles utilizados en la primera prueba y, a continuación, utilice estos valores para ponerlos a prueba contra el tercer nivel. Aquí, vamos a decir que la prueba B contra C primero.

Obs   Rec    Ret    Total
B   17530    717    18247
C   42408   1618    44026

Exp     Rec    Ret  Total
B   17562.8  684.2  18247
C   42375.2 1650.8  44026

Esto produce un G-stat de 2.29 1 de df, que no es significativo (p = 0.1300). A continuación, hacer una nueva tabla, la combinación de filas de B y C. Ahora prueba a contra B+C.

Obs   Rec    Ret    Total
A   16895    934    17829
B+C 59938   2335    62273

Exp     Rec    Ret  Total
A   17101.4  727.6  17829
B+C 59731.6 2541.4  62273

Esto produce un G-stat de 74.13, el 1 de df, que es también altamente significativa (p < 0.0001).

Usted puede comprobar su trabajo mediante la adición de los dos más pequeños de la estadística de prueba, que debe ser igual a la mayor estadística de prueba. Lo que hace: 2.29 + 74.13 = 76.42

La historia aquí es que el B y C de los grupos no son significativamente diferentes, pero que el grupo a tiene una mayor tasa de retorno que B y C combinadas.

Espero que ayude!

Usted también podría tener particionada la G-stat de forma diferente mediante la comparación de la a a la primera B, luego C = a+B, o mediante la comparación de a a C, entonces B = a+C. Además, puede ampliar esta a 4 o más grupos, pero después de cada prueba tiene derrumbe de las dos filas que se acaba de probar, con un número máximo de pruebas igual a la df en la tabla original. Hay otras formas de hacer la partición con las tablas más complicadas. Agresti del libro, "Análisis de Datos Categóricos", debe tener los detalles. Específicamente, el capítulo de la inferencia para dos vías de tablas de contingencia.

1voto

mattsmith321 Puntos 1729

Yo simplemente calcular las probabilidades (o riesgo) relaciones entre el grupo a y B, entre B y C, y entre a y C y ver si son estadísticamente diferentes. No veo una razón para hacer una "omnibus" proporciones de la prueba en este caso, ya que sólo tiene tres grupos. Tres pruebas de chi cuadrado podría hacer el truco también.

Como algunos de los individuos descritos en los comentarios de abajo, y la regresión logística, con la previsión de contrastes que iba a funcionar bien también.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X