Tengo un número de alumnos y sus calificaciones a través de una serie de pruebas, todos los cuales tienen igual importancia en mi modelo. Me gustaría identificar el puntaje más alto entre los estudiantes (por ejemplo, 10%).
Mi primera idea era media de rangos percentiles y trabajar desde allí. Sin embargo, yo no podía llegar con una forma de atribuir significación estadística a los resultados que me gustaría conseguir.
Mi segunda idea es la siguiente. En primer lugar, tomar una prueba en un tiempo y convertir las puntuaciones de todos los estudiantes en esta prueba para $z$-de las puntuaciones. Segundo, realizar una muestra de $t$-prueba para cada estudiante, con las siguientes hipótesis:
$\mathcal{H}_0$: Promedio de $z$-de las puntuaciones de todas las pruebas es igual a 0.
$\mathcal{H}_A$: Promedio de $z$-de las puntuaciones de todas las pruebas es mayor que 0.
Este procedimiento me iba a dar un $p$-valor para cada estudiante. Entonces yo podría establecer un umbral $T$ de manera tal que sólo aproximadamente el 10% de los estudiantes a lograr la $p$-valores inferiores a $T$.
¿Este enfoque de sentido? ¿Cuáles podrían ser sus advertencias? Por otro lado, si no tiene sentido, se puede esbozar una alternativa?
Mi interés está en un enfoque que se ocupa de la clase de problemas en los que tengo un conjunto de objetos (en el orden de miles) y sus resultados a través de una serie de igualmente importantes eventos, es decir, no necesariamente el alumno-escenario de prueba.