Trabajo en la investigación de servicios sanitarios. Recogemos resultados comunicados por los pacientes, por ejemplo, la función física o los síntomas depresivos, y con frecuencia se puntúan en el formato que usted ha mencionado: una escala de 0 a N generada por la suma de todas las preguntas individuales de la escala.
La gran mayoría de la literatura que he revisado ha utilizado simplemente un modelo lineal (o un modelo lineal jerárquico si los datos provienen de observaciones repetidas). Todavía no he visto a nadie utilizar la sugerencia de @NickCox de un modelo logit (fraccionario), aunque es un modelo perfectamente plausible.
La teoría de la respuesta al ítem me parece otro modelo estadístico plausible de aplicar. Aquí es donde se asume algún rasgo latente $\theta$ causa las respuestas a las preguntas utilizando un modelo logístico o logístico ordenado. Eso maneja intrínsecamente los problemas de limitación y posible no linealidad que Nick planteó.
El gráfico que aparece a continuación procede de mi próximo trabajo de tesis. En él, he ajustado un modelo lineal (en rojo) a una puntuación de síntomas depresivos convertida en puntuaciones Z, y un modelo IRT (explicativo) en azul a las mismas preguntas. Básicamente, los coeficientes de ambos modelos están en la misma escala (es decir, en desviaciones estándar). De hecho, hay bastante acuerdo en el tamaño de los coeficientes. Como ha aludido Nick, todos los modelos son erróneos. Pero es posible que el modelo lineal no sea tan erróneo como para utilizarlo.
Dicho esto, un supuesto fundamental de casi todos los modelos actuales de TRI es que el rasgo en cuestión es bipolar, es decir, que su apoyo es $-\infty$ a $\infty$ . Probablemente no sea así en el caso de los síntomas depresivos. Los modelos para los rasgos latentes unipolares todavía están en desarrollo, y el software estándar no puede ajustarse a ellos. Muchos de los rasgos que nos interesan en la investigación de los servicios sanitarios son probablemente unipolares, por ejemplo, los síntomas depresivos, otros aspectos de la psicopatología, la satisfacción del paciente. Así que el modelo IRT también puede ser erróneo.
(Nota: el modelo anterior se ha ajustado utilizando el modelo de Phil Chalmers mirt
en R. Gráfico elaborado con ggplot2
y ggthemes
. El esquema de colores se basa en el esquema de colores por defecto de Stata).