2 votos

Importancia de los efectos en el análisis de datos ordinales con modelos de enlace acumulativo

Estoy tratando de analizar algunas mediciones repetidas en las que la variable "dependiente" es ordinal. Por lo que he entendido en la bibliografía que he leído hasta ahora, el camino correcto es el de los modelos mixtos de enlace acumulativo.

Los datos tienen variables independientes con diferentes duraciones para cada "sesión". Estoy planeando

a) ajustar cada variable con la variable ordinal con algo como

Y~ measurement value + 1|subject donde Y es la puntuación del valor ordinal, los valores de medición son numéricos continuos, el tema es autoexplicativo. A partir de esto intentaré ver la dependencia/efecto entre Y y el valor de medición.

b) Después de agregar adecuadamente las variables de medición, intentaré hacer un modelo más grande que contenga más variables.

¿Es una estrategia correcta? En caso afirmativo: tengo previsto utilizar el paquete Ordinal en R. En el paso a) he ejecutado algunos modelos ficticios. Los resultados de 'clmm()' son así:

     link  threshold nobs logLik   AIC      niter      max.grad cond.H 
     logit flexible  4390 -6066.11 12156.21 1370(9263) 9.29e-04 2.9e+05
     Random effects:
     Groups  Name        Variance Std.Dev.
     Period  (Intercept)  3.565   1.888   
     Subject (Intercept) 10.049   3.170   
     Number of groups:  Period 5,  Subject 4 

     Coefficients:
     Estimate Std. Error z value Pr(>|z|)  
     value 0.017104   0.009952   1.719   0.0857 .

Los autores del paquete ordinal afirman que "El número de condición del hessiano mide la identificabilidad empírica del modelo. Números altos, digamos mayores de 10^4 o 10^6 indican que el modelo está mal definido". viñeta de clmm

¿Debo interpretar la declaración anterior literalmente, es decir, un modelo con cond. Hessain < 10^4 está bien definido? ¿Cómo puedo evaluar este tipo de modelos?

3voto

Bruce ONeel Puntos 391

a) ajustar cada variable con la variable ordinal con algo como

Y~ valor de medición + 1|sujeto donde Y es la puntuación del valor ordinal, los valores de medición son numéricos continuos, el sujeto es autoexplicativo. A partir de esto, intentaré ver la dependencia/efecto entre Y y el valor de medición.

b) Después de agregar adecuadamente las variables de medición, intentaré hacer un modelo más grande que contenga más variables.

Esto parece un procedimiento escalonado y sería mejor evitarlo. Un mejor enfoque para la selección de variables, especialmente es elegir sus variables de interés a priori teniendo en cuenta los factores de confusión.

¿Por qué quiere agregar las variables de medición?

clmm en el ordinal sería un buen punto de partida. También puede considerar MCMCglmm pakcage para un enfoque totalmente bayesiano.

En cuanto al número de condición, si el modelo ha convergido sin advertencias, entonces todo debería estar bien, incluso con un número de condición alto. Incluso cuando está mal condicionada, una matriz puede seguir siendo invertible. El problema es que cambios muy pequeños en la matriz pueden hacerla no invertible. Si el modelo tarda mucho en converger, o genera advertencias/errores y tiene un número de condición alto, entonces puede ser capaz de superar esto centrando y/o reescalando algunos de los datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X