Estoy buscando una manera algorítmica para resolver el siguiente problema.
Problema
Decir que hemos dado un examen de opción múltiple con 100 preguntas, con 4 respuestas por pregunta (exactamente uno de los cuatro está correcto), correctamente cada respuesta vale un punto, respuesta incorrecta vale cero puntos. Si ahora tenemos una base de datos D de un montón de hojas de respuesta y sus correspondientes puntos, por ejemplo,
D:= { ('ABAA...', 80), ('ABAB...', 80), ('ABAC...', 80), ('ABAD...', 81), ... }
¿Cómo podemos saber que las respuestas son correctas? No estoy buscando algo probabilístico, pero las respuestas que son sin duda correcta.
Algunas ideas
Hay algunas estrategias obvias como:
- busque a alguien que alcanzó los 100 puntos; tienes todas tus respuestas
- buscar pruebas, cuyas respuestas se diferencian sólo por uno (en el ejemplo de base de datos dada, podemos deducir la respuesta a la pregunta 4 "D")
- busque a alguien que respondió todo mal, puede descartar las respuestas a esas preguntas
Pero ¿qué información podemos obtener de otras combinaciones de respuestas?
La visualización de las hojas de respuesta como un espacio métrico tenemos
100 - S(prueba) = d(prueba, correcto)
para la distancia de hamming d(.,.), la puntuación de S(.) y la hoja correcta correcta.
Tal vez alguien me podría dar una reformulación del problema, lo que produce un mayor aplicación obvia. Cualquier aporte es apreciado.
Editar:
No teniendo en cuenta la complejidad del cálculo, no puedo lograr algo por la intersección de las bolas $$ \bigcap_i B_{d(t_i,\textrm{correcto})}(t_i), $$ con las pruebas de $t_i$ y bolas $B_d(x) := \{y: d(x,y)\leq d\}$?