Suponga que tiene las notas del primer, segundo y último examen de un grupo de estudiantes. Supongamos que un alumno falta al primer y/o segundo examen. ¿Cuáles son los enfoques estadísticos más apropiados que pueden utilizarse para predecir la puntuación que falta?
Respuestas
¿Demasiados anuncios?Existen numerosas formas de tratar los valores que faltan, lo que se denomina Imputación . Los enfoques más comunes son:
- Utilizar la nota media del examen
- Utilice la calificación del otro estudiante más cercano (más similar en cuanto a la calificación) (o una media de $k$ estudiantes más cercanos)
En el segundo caso, hay que tratar de alguna manera el cálculo de su similitud con los valores que faltan. Sin más detalles, no es posible decir cuál es la forma más adecuada para su problema.
Estimar la distribución conjunta de la Puntuación 1, la Puntuación 2 y la Puntuación 3. Si tiene muchas observaciones (más de 1000), puede intentar estimar la distribución de forma no paramétrica (utilizando la fdc empírica conjunta, por ejemplo). En los casos de menor tamaño de muestra, tendría que postular una familia paramétrica, como la normal multivariante, la de Student multivariante, etc. Puede estimar el modelo utilizando información completa máxima verosimilitud y, a continuación, calcular la predicción de una puntuación determinada como su expectativa condicional teniendo en cuenta las demás puntuaciones.