Tengo un conjunto de datos con el siguiente aspecto.
test.takers item1 item2 item3 item4 item5 item6 item7 item8 item9 item10 item11 item12 item13 item14 item16 item17 item18 total_score
tt1 1 1 0 1 0 1 1 1 0 NA 1 1 NA 1 1 1 1 12
tt2 0 1 0 0 0 0 0 NA 1 1 NA 0 1 0 NA 1 0 6
tt3 1 1 1 1 0 0 NA 1 NA NA 1 1 1 NA 0 NA 0 8
tt4 1 1 1 0 1 NA 1 1 0 0 NA 1 NA 1 0 0 NA 8
tt5 0 1 1 0 1 1 NA NA 0 1 1 1 NA 0 0 1 1 9
tt6 0 0 0 1 1 1 1 NA 1 1 1 NA 1 1 NA 0 0 9
tt7 1 0 0 1 1 1 1 1 NA 0 1 1 1 0 1 1 NA 11
El conjunto de datos consta de 3.000 examinados con sus respuestas en una prueba de habilidad. No todos los examinados pudieron responder a los 18 ítems. Así, algunos examinados sólo vieron 10 ítems, otros sólo 12, etc. El resultado es un marco de datos con muchos NA. Ahora quiero calibrar los parámetros de los ítems utilizando un modelo 2pl irt. Y después quiero calibrar las habilidades de los examinados en el mismo conjunto de datos. El problema al que me enfrento es que no puedo encontrar un paquete de R que pueda manejar la calibración en un marco de datos con datos perdidos.
¿Alguien sabe de algún paquete o función de R que pueda hacer el trabajo por mí o sabe cómo tratar este problema de alguna otra manera genial?
0 votos
La pregunta me recuerda a algo que leí una vez, pero no lo he aplicado, así que no puedo dar más información, y no sé si es útil en tu caso: "Los datos que faltan se pueden manejar en el paquete smacof pasando el argumento weightmat a la función smacofIndDiff".
1 votos
Puede que me esté perdiendo algo en su pregunta, pero tanto el
ltm
ymirt
pueden manejar los datos que faltan sin problemas para los modelos 2PL. ¿Ha probado alguno de esos paquetes? Además, la razón por la que no publiqué esta respuesta es porque me preocupa cómo se produjeron los datos faltantes. ¿Se puede suponer que los NA son MCAR o MAR?0 votos
Gracias por su respuesta. ¡He examinado el paquete ltm una vez más y parece ser capabel para tratar el problema! Como me centré primero en el paquete irtoys (y al principio me encontré con errores al utilizar ltm), concluí erróneamente que la calibración no era posible con mi conjunto de datos. Se puede suponer que los NA son MCAR.
0 votos
Bien, genial. Añadiré un ejemplo de cómo se hace con ambos paquetes entonces como respuesta
0 votos
Un gran material para examinar. Mi objetivo final es obtener las habilidades del examinador en este conjunto de datos. @Philchalmers, ¿crees que es una forma adecuada de obtener las habilidades de los examinados de esta manera, y utilizando tu solución como paso 1?
0 votos
Sí, creo que sí, ya que todas las estimaciones se basarán en el patrón de respuesta disponible de cada participante, mientras que las AN no aportarán ninguna información adicional a la puntuación latente. Este enfoque también le indicará el error relativo en las respuestas que contienen datos perdidos con sólo llamar a
fscores(mirtmod)
(o, por el contrario, elfactor.scores(ltmmod)
) y observando los valores del error estándar. Puede probar otros estimadores (por ejemplo, ML, MAP, etc.) pero todos ellos tendrán las propiedades que he mencionado