Se trata de una pregunta suave sobre el desarrollo de software para resolver problemas de exámenes/concursos.
Imagina el siguiente escenario: Usted, como usuario, tiene (digamos) una hoja de examen de la OMI. Escribe una pregunta cada vez, quizás en algún formato legible por la máquina, en una interfaz de línea de comandos como Matlab. Un minuto más tarde, su programa escupe la respuesta (y también los pasos de prueba/derivación necesarios), y tal vez en 15 minutos, ha resuelto todo el trabajo con ayuda electrónica, pero para el que su puntuación habría sido de 42/42. Además, tienes la seguridad de que tu respuesta ha sido comprobada y cotejada por tu amigo con poder de silicona. Además, suponga que le muestra el resultado a un juez de la OMI, que no dudaría en otorgarle una puntuación completa, salvo por el hecho de que le cuesta un poco de esfuerzo leer el formato "maquinal" del resultado.
Un diseño rudimentario tendría Matlab (para el cálculo) y Mizar (para el razonamiento lógico) en el back-end, y si fuera necesario un motor de procesamiento del lenguaje natural en el front-end. Tenga en cuenta que hay dos grandes obstáculos, tal y como yo lo veo:
- El motor de lenguaje natural tendría que ser muy sofisticado para entender las sutilezas de los problemas matemáticos, expresados en inglés.
- El software existente, como Matlab, es probablemente más adecuado para los problemas que se ajustan a una plantilla (por ejemplo, la inversión de matrices), pero no es muy útil para, por ejemplo, una ecuación funcional que debe resolverse mediante un truco inteligente. Un examinador siempre puede inventar un nuevo "truco inteligente" más allá de lo que los diseñadores del software han pensado.
Pregunta: ¿Existe una herramienta de este tipo? ¿Le interesaría a alguien que se desarrollara? ¿Algún comentario abierto?
Por otro lado, esta herramienta, si se desarrolla, puede aplicarse a una gran variedad de exámenes (GRE, SAT, exámenes de "acceso a la ingeniería" en la India); podemos hacer que un estudiante y un ordenador realicen el examen uno al lado del otro para determinar los puntos fuertes y débiles de dicho software.