8 votos

Pares de binomiales coincidentes

Estoy tratando de analizar la siguiente tabla:

5 5 5 5 4 5 5 5 5

3 4 3 3 4 4 3 5 5

Cada número es un éxito puntaje de 5 intentos, así que podemos asumir binomial (p, 5), de desconocido p. Cada columna corresponde a una persona. La fila inferior contiene el "pre" de los resultados de la prueba y la fila superior es el "post" de los resultados de la prueba.

En un vistazo rápido, cada elemento de la fila superior es al menos tan grande como el elemento correspondiente en la fila inferior, de modo que por una rápida señal de prueba, la hipótesis de que existe una diferencia pre y post debe ser significativa.

Si hago una prueba t pareada en estos datos (celebración de mi nariz, debido a que cada elemento es binomial (p,5)) puedo obtener un resultado significativo. Si pongo los datos en un 2 x 2 tabla de contingencia (pre post correcto incorrecto x) e ignorar la coincidencia, puedo obtener un resultado significativo.

Pero cuando hago una contingencia de prueba de la tabla anterior, las pruebas de independencia condicional en los márgenes, el resultado es no significativo (p = 0.97). He utilizado fisher.prueba en R, la prueba exacta de Fisher.

Entonces, ¿cuál es la mejor manera de poner a prueba la hipótesis de que existe una diferencia significativa, pre y post, teniendo coincidentes en cuenta? ¿Y por qué el análisis de la independencia no se aplican aquí?

5voto

Uri Puntos 111

Les recomendamos el uso de Ecuaciones de Estimación Generalizada (GEE). Esto es análogo a medidas Repetidas ANOVA pero permite no continua o no respuesta normal porque, al ser un modelo lineal Generalizado, que adopta diversas funciones de enlace.

Con su ejemplo, yo uso la distribución binomial logit con el enlace (aunque es posible que prefiera probit). Los datos de entrada se reestructuró a partir de "ancho" a "larga", que aparece esto:

   id pre_post count
    1   1       5
    2   1       5
    3   1       5
    4   1       5
    5   1       4
    6   1       5
    7   1       5
    8   1       5
    9   1       5
    1   2       3
    2   2       4
    3   2       3
    4   2       3
    5   2       4
    6   2       4
    7   2       3
    8   2       5
    9   2       5

El DV es contar, mucho que el encuestado marcó fuera de 5 intentos. pre_post es el de medidas repetidas niveles de factor de la que desea comparar. Id es demandado. Voy a utilizar el programa SPSS para su análisis; el comando a continuación.

GENLIN count /*response variable: score
  OF 5 /*out of 5 trials
  BY pre_post
 /MODEL pre_post INTERCEPT=YES /*the only factor to test is pre_post
  DISTRIBUTION=BINOMIAL LINK=LOGIT
 /REPEATED SUBJECT=id WITHINSUBJECT=pre_post /*id is respondent id, pre_post is the repeated measures factor
  CORRTYPE=INDEPENDENT ADJUSTCORR=YES /*we'll assume Independent correlation structure.

Aquí es un extracto de los resultados:

enter image description here

Usted ve que es una diferencia significativa entre el pre y el post. Habitual RM ANOVA (pares de muestras t-test) dio cerca de significación .007.

4voto

Boar Puntos 48

No creo que la prueba exacta de fisher es apropiado aquí es?

Es decir que el pre-test hay 34 puntos dispuestos en esta forma (343344355), y que la prueba post que hay 44 puntos. La disposición de los 44 puntos es consistente con el patrón (marginal) establecido en el pre-test. También está diciendo que cada emparejamiento similar (fila de la parte de la prueba) - por lo general la gente mejor en la segunda prueba por la misma cantidad.

Prueba de Fisher no es prueba de que las filas son iguales, sólo que son independientes de las columnas. Desea responder a la pregunta "¿la gente a hacer mejor post-test", pero la prueba de fisher es la pregunta "¿todas las personas a hacer mejor en el post-test en el mismo camino".

Creo que la prueba del signo es perfectamente apropiado aquí, y acabo de ver a @ttnphns respuesta aparezca lo que es particularmente bueno.

2voto

unk2 Puntos 36

Otra opción sería ejecutar un binomio modelo mixto. Usted necesitará el código de los datos como este:

result  id  time
 0       1   pre
 0       1   pre
 1       1   pre
 1       1   pre
 1       1   pre
 1       1   post
 1       1   post
 1       1   post
 1       1   post
 1       1   post

Con la R paquete lme4 a continuación, puede ejecutar el modell

lmer(result ~ timepoint + (1|id), family = "binomial")

Pero con resultados como estos sospecho que cualquier método que se va a entregar resultados importantes, y de que está correctamente conveniente si se utiliza un método con el sonido de fondo teórico con el que se sienta cómodo Y los rendimientos de la respuesta que deseas.

La señal de prueba es absolutamente suficiente y apropiado si desea mostrar una mejora, pero cuando se desea cuantificar la mejora y la variación entre los individuos de empezar necesidad de modelos más complejos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X