4 votos

¿La introducción de penalizaciones por obtener preguntas de verdadero/falso incorrectas da lugar a una mayor penetración de la habilidad (menos suerte/varianza)?

A un alumno se le pide que responda a 50 preguntas de verdadero/falso y acertaría 35 y 15 no serían correctas si tuviera que poner sus mejores aciertos para cada pregunta.

Ahora, para cada pregunta tiene una determinada confianza de acertar el problema y si empezamos a imponer penalizaciones por equivocarse en una pregunta, puede adaptarse fácilmente respondiendo sólo a las preguntas con un nivel de confianza equivalente a la relación [punto de penalización si se equivoca]/[punto de recompensa si acierta], y dejar todas las demás en blanco.

¿Hay alguna manera de que el diseñador de la prueba diseñe un esquema de recompensa/penalización que maximice la penetración de la habilidad y reduzca el papel de la suerte y, si es así, qué factores tiene que tener en cuenta el diseñador?

Supongamos que las preguntas del examen tienen una dificultad creciente de forma que cubramos todo el espectro de confianza en el alumno.

EDIT: Otra idea sería dejar que el alumno apueste con puntos. También establecer un límite en cada pregunta y un límite global de apuestas.

¿Existe algún esquema razonable para reducir el papel de la suerte en general en las preguntas de verdadero y falso?

4voto

vadim123 Puntos 54128

Para maximizar la penetración de la habilidad, otorgue 1 punto por cada respuesta correcta, y -1000 por cada respuesta incorrecta. Nota: esto no es una broma, es la forma de obtener sólo las respuestas en las que el estudiante está totalmente seguro.

En su ejemplo, los conocimientos del alumno son nulos en términos netos, obteniendo la misma puntuación que si adivinara al azar. Es poco probable que un estudiante así adapte su estrategia de examen a las sutiles recompensas y penalizaciones.

Comentario adicional sobre los juegos de azar: Supongamos que se deja que cada alumno dé un peso a cada pregunta, de cualquier número real en $[0,1]$ así como la respuesta T/F. Si acierta, el alumno gana esa cantidad de puntos, si se equivoca, pierde. Ingenuamente se podría pensar que esto animaría a los estudiantes a sopesar más las preguntas si están más seguros, y menos en caso contrario. De hecho, esto no es cierto. Si tengo un 51% de confianza en que la respuesta es verdadera, maximizaré mi puntuación ponderándola con 1 en lugar de cualquier otra cosa.

Supongamos que, en cambio, permite a los alumnos ponderar como en el caso anterior, pero esta vez si se equivocan pierden el DOBLE de su apuesta. Si tengo razón con probabilidad $p$ mi puntuación esperada es $pw-2(1-p)w=w(3p-2)$ . Lo único que hace este cambio es mover el umbral de $p=\frac{1}{2}$ a $p=\frac{2}{3}$ . Si creo que $p>\frac{2}{3}$ debería apostar el máximo, de lo contrario debería apostar 0.

Resultado: en todos los esquemas de juego similares, nunca hay razón para apostar nada más que el máximo (o cero/dejar la pregunta en blanco).

2voto

Gene Choin Puntos 1

Por lo general, el esquema de recompensa/penalización por defecto para un examen de verdadero/falso es otorgar 1 punto por una respuesta correcta y quitar 1 punto por una respuesta incorrecta, de modo que el valor esperado por responder al azar es cero (ya que responder al azar es generalmente la estrategia óptima de menor valor para responder que se puede elegir, y los responsables del examen quieren que esta estrategia sea equivalente a no responder en absoluto).

En tu caso, estás preguntando si hay alguna manera de intentar cambiar las recompensas y las penalizaciones hacia arriba o hacia abajo para que sólo la gente con cierta confianza en su respuesta se moleste en responder a la pregunta (para maximizar las "respuestas basadas en la habilidad" y minimizar las "respuestas basadas en la suerte"). En el esquema por defecto anterior, cualquier confianza superior a "no lo sé en absoluto, así que voy a adivinar al azar" obtendrá una recompensa positiva, pero el valor esperado por responder al azar es cero. Cualquier esquema que maximice las "respuestas basadas en la destreza" tendrá que establecer este valor esperado por debajo de cero.

En el caso de las preguntas de verdadero/falso y de las preguntas de opción múltiple en general, lo único que se puede hacer realmente es modificar la penalización de las respuestas erróneas para cambiar el valor esperado de la respuesta al azar. Dependiendo del nivel de confianza que requiera para que una respuesta sea una "respuesta basada en la habilidad", este valor será diferente.

En mi clase de probabilidad de hace dos trimestres, formulamos el modelo de "respuesta basada en la habilidad" como sigue: Si un estudiante es $x$ % de confianza en su respuesta, elegirá la respuesta correcta con $x$ % de probabilidad y adivinar al azar en caso contrario. En su situación, fijaría el valor esperado para este nivel de confianza mínimo en cero imponiendo la penalización adecuada.

Por ejemplo, si exige un 70% de posibilidades de que el alumno conozca la respuesta y adivine al azar en caso contrario, establezca la penalización por una respuesta incorrecta en $-5.6666666$ (es decir, -85/15), porque con un 70% de confianza, el alumno cree que responderá correctamente el 85% de las veces y de forma incorrecta el 15%. Si necesita un 99,9% de confianza, fije la penalización en $-1999$ (-99.95/0.05).

Lo que habría que probar experimentalmente es qué nivel de confianza requerido es lo suficientemente alto como para bloquear las respuestas basadas en la suerte, pero lo suficientemente bajo como para mantener las respuestas basadas en la habilidad. Sin embargo, no estoy seguro de cómo se puede probar esto, ya que la estrategia de cada estudiante es diferente y siempre es posible que un estudiante confíe en la respuesta incorrecta.

Ten en cuenta que con este esquema, las puntuaciones serán mucho más bajas de lo que esperas (ya que habrá muchas respuestas en blanco de examinados descontentos), y tendrás que ajustar la nota de aprobado en consecuencia. Ten en cuenta también que, debido al gran número de respuestas en blanco, tendrás que tener muchas más preguntas sólo para mantener la resolución de los resultados del examen por encima de un cierto nivel. Independientemente de cómo se corte el esquema, una prueba en la que sólo se haya respondido una media de una pregunta no tendrá la baja varianza que usted busca.


En general, sin embargo, las preguntas de verdadero/falso con esquemas de penalización no son una buena forma de evaluar los conocimientos de los alumnos en un examen, porque desaniman a los estudiantes a intentar responder a una pregunta, aunque puedan conocer la respuesta y no sepan que la saben. También son terribles a la hora de discernir una suposición afortunada de una respuesta correctamente planteada (y una suposición desafortunada de una respuesta incorrectamente planteada), independientemente de cómo se intente y se repartan las penalizaciones, ya que al final sólo hay tres resultados posibles (verdadero / falso / sin respuesta).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X