En una tabla como esta se puede partición de la G-estadística producida por un G-test, en lugar de calcular las sales de rehidratación oral o mediante la ejecución de una regresión logística. Aunque usted tiene que decidir cómo va a partición. Aquí, el G-estadística, que es similar a la de Pearson X^2 y también sigue un X^2 distribución es la siguiente:
G = 2 * sum(OBS * ln(OBS/EXP)).
Primero se calcula que para el total de la tabla, en este caso: G = 76.42, el 2 de df, que es altamente significativa (p < 0.0001). Es decir que la tasa de retorno depende del grupo (a, B o C).
Luego, debido a que tiene 2 df, puede realizar dos pequeños 1 df (2x2) G-test. Después de realizar la primera, sin embargo, usted tiene que colapsar las filas de los dos niveles utilizados en la primera prueba y, a continuación, utilice estos valores para ponerlos a prueba contra el tercer nivel. Aquí, vamos a decir que la prueba B contra C primero.
Obs Rec Ret Total
B 17530 717 18247
C 42408 1618 44026
Exp Rec Ret Total
B 17562.8 684.2 18247
C 42375.2 1650.8 44026
Esto produce un G-stat de 2.29 1 de df, que no es significativo (p = 0.1300). A continuación, hacer una nueva tabla, la combinación de filas de B y C. Ahora prueba a contra B+C.
Obs Rec Ret Total
A 16895 934 17829
B+C 59938 2335 62273
Exp Rec Ret Total
A 17101.4 727.6 17829
B+C 59731.6 2541.4 62273
Esto produce un G-stat de 74.13, el 1 de df, que es también altamente significativa (p < 0.0001).
Usted puede comprobar su trabajo mediante la adición de los dos más pequeños de la estadística de prueba, que debe ser igual a la mayor estadística de prueba. Lo que hace: 2.29 + 74.13 = 76.42
La historia aquí es que el B y C de los grupos no son significativamente diferentes, pero que el grupo a tiene una mayor tasa de retorno que B y C combinadas.
Espero que ayude!
Usted también podría tener particionada la G-stat de forma diferente mediante la comparación de la a a la primera B, luego C = a+B, o mediante la comparación de a a C, entonces B = a+C. Además, puede ampliar esta a 4 o más grupos, pero después de cada prueba tiene derrumbe de las dos filas que se acaba de probar, con un número máximo de pruebas igual a la df en la tabla original. Hay otras formas de hacer la partición con las tablas más complicadas. Agresti del libro, "Análisis de Datos Categóricos", debe tener los detalles. Específicamente, el capítulo de la inferencia para dos vías de tablas de contingencia.