2 votos

si los residuos de los datos proporcionales se distribuyen normalmente, ¿es correcto utilizar el lmer? ¿en cuántas pruebas debo confiar para evaluar la normalidad?

Tengo 36 ratas, algunas son altamente impulsivas (HI), otras son poco impulsivas (LI) y otras son MID. Las he sometido en dos días distintos a una tarea de atención con un paradigma de ITI variable en el que una señal se presenta de forma pseudo-aleatoria después de 3s, 5s, 7s y 9s. Estoy observando la probabilidad de dar una respuesta correcta (VD) en función del fenotipo de impulsividad (3 niveles); el día (2 niveles) y el ITI (4 niveles), mi efecto aleatorio es rat_ID.

He leído por ahí que para datos proporcionales de este tipo debería usar glmer, lo he probado con el paquete afex y creo que he conseguido que funcione, ver código abajo:

m1 <- mixed(prob_correct ~ Day*impulsivity*ITI +(1|rat_ID), data = mydat2, method = "LRT", family = binomial, weight = mydat2$count)
m1 # prints tests of effects

main_contrasts = emmeans(m1, pairwise~ impulsivity|ITI, type = "response")
main_contrasts

Mixed Model Anova Table (Type 3 tests, LRT-method)

Model: prob_correct ~ Day * impulsivity * ITI + (1 | rat_ID)
Data: mydat2
Df full model: 25
               Effect df       Chisq p.value
1                 Day  1  210.18 ***   <.001
2         impulsivity  2    13.12 **    .001
3                 ITI  3 2070.49 ***   <.001
4     Day:impulsivity  2   19.40 ***   <.001
5             Day:ITI  3  120.19 ***   <.001
6     impulsivity:ITI  6  457.07 ***   <.001
7 Day:impulsivity:ITI  6   49.38 ***   <.001

La forma en que informo de estos datos es, por ejemplo, <<hubo una interacción entre ITI e impulsividad chi^2(6) = 457,07, p<.001. Los contrastes post-hoc encontraron que, etc. >>

Sin embargo, no estoy seguro al 100% de que este método se ajuste a mis datos correctamente, obtengo muchos contrastes significativos, así que me estoy preocupando un poco. Sin embargo, la media que obtengo en la salida de contraste se parece a mis datos reales.

Por otro lado me han dicho que si ajusto lmer a estos datos y los residuos parecen distribuidos aproximadamente de forma normal, puedo usar lmer (que me da más confianza). código abajo:

lmecoeff<- lmer(prob_correct~Day*ITI*impulsivity+(1|rat_ID), na.action=na.omit, data= mydat2)

Observo los residuos trazando un histograma, haciendo una prueba de shapiro, trazando gráficos QQ, observando la curtosis y la asimetría. A menudo los histogramas, los gráficos QQ y la asimetría se ven bien, pero mi prueba de shapiro me dice que los datos no están distribuidos normalmente y la curtosis también tiene valores altos a veces, ¿debería entonces utilizar glmer? ¿En cuántas pruebas de normalidad debo basarme para juzgar si puedo utilizar lmer o si, en cambio, tengo que recurrir a glmer?

Gracias.

2voto

Bruce ONeel Puntos 391

A menudo los histogramas, los gráficos QQ y la asimetría se ven bien, pero mi prueba de shapiro me dice que los datos no están distribuidos normalmente

Esto es muy común.

¿debo entonces utilizar glmer? ¿En cuántas pruebas de normalidad debo basarme para juzgar si puedo utilizar lmer o si, en cambio, debo recurrir a glmer?

La suposición de normalidad es siempre aproximada. En la práctica, lo mejor es observar un histograma y el gráfico QQ y juzgar si son plausiblemente normales, en lugar de utilizar la prueba de Shapiro Wilk u otra prueba formal. Las desviaciones leves de la normalidad no son un problema.

Además, conviene recordar que la normalidad de los residuos sólo es necesaria para calcular los valores p, y no se debe confiar en los valores p para nada útil.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X