7 votos

Top puntuación los estudiantes a través de una serie de pruebas

Tengo un número de alumnos y sus calificaciones a través de una serie de pruebas, todos los cuales tienen igual importancia en mi modelo. Me gustaría identificar el puntaje más alto entre los estudiantes (por ejemplo, 10%).

Mi primera idea era media de rangos percentiles y trabajar desde allí. Sin embargo, yo no podía llegar con una forma de atribuir significación estadística a los resultados que me gustaría conseguir.

Mi segunda idea es la siguiente. En primer lugar, tomar una prueba en un tiempo y convertir las puntuaciones de todos los estudiantes en esta prueba para $z$-de las puntuaciones. Segundo, realizar una muestra de $t$-prueba para cada estudiante, con las siguientes hipótesis:

$\mathcal{H}_0$: Promedio de $z$-de las puntuaciones de todas las pruebas es igual a 0.
$\mathcal{H}_A$: Promedio de $z$-de las puntuaciones de todas las pruebas es mayor que 0.

Este procedimiento me iba a dar un $p$-valor para cada estudiante. Entonces yo podría establecer un umbral $T$ de manera tal que sólo aproximadamente el 10% de los estudiantes a lograr la $p$-valores inferiores a $T$.

¿Este enfoque de sentido? ¿Cuáles podrían ser sus advertencias? Por otro lado, si no tiene sentido, se puede esbozar una alternativa?

Mi interés está en un enfoque que se ocupa de la clase de problemas en los que tengo un conjunto de objetos (en el orden de miles) y sus resultados a través de una serie de igualmente importantes eventos, es decir, no necesariamente el alumno-escenario de prueba.

4voto

mattsmith321 Puntos 1729

El método que se describe parece bastante complicado (y tal vez bastante inexacta). Presumiblemente, la medida de las pruebas de algún tipo de rasgo (por ejemplo, la inteligencia), o la capacidad (por ejemplo, la habilidad matemática), o la experiencia (por ejemplo, aprendizaje), y desea que el 10% superior de los estudiantes que obtienen una puntuación más alta en este constructo. También menciona tener una serie de pruebas, lo que sugiere usted tiene varias de las puntuaciones. Si estas pruebas están relacionadas, y que miden la misma capacidad, entonces ¿por qué no usted no es simplemente la suma de puntuaciones de todas las pruebas? Usted podría utilizar sólo la parte superior del 10% sobre las primas de calificaciones para identificar el 10% superior.

Si quieres ir un poco más complejo, podría utilizar exploratorio/análisis factorial confirmatorio para calcular ponderado puntaje basado en la asociación entre cada una de las escalas y la capacidad que desea evaluar.

También puede utilizar los aspectos de la teoría de respuesta al ítem para identificar los más fuertes de los tomadores de la prueba.

Uno de los problemas es la mención de "significación estadística". No sé a qué se refiere aquí. Parece que quieren identificar a los individuos, y esto parece más descriptivo que la correspondiente a la significación estadística y null-pruebas de hipótesis. Si desea algún tipo de índice fiable de cómo sus estimaciones, previsiones o error/información será valiosa, no la significación estadística de por sí.

3voto

goangit Puntos 433

Estoy de acuerdo con los comentarios de arriba que esto sería más fácil si la pregunta fuera un poco más preciso.

Aquí están algunas cosas a considerar.

set.seed(1)

## simulate data: refine to reflect attributes of interest

n <- 30  ## test count
m <- 100 ## student count

## student "ability": student rows, test columns
sa <- matrix(round(runif(m*n,30,80)), nrow=m)

te <- 5 ## test error

## test scores:
ts <- matrix(round(rnorm(m*n, sa, te)),nrow=m)
rownames(ts) <- seq(m)

Método A:

El uso de una medida de resumen que se derrumba la variabilidad de los estudiantes en las pruebas.

## test score summary
tss <- apply(ts,1,mean)

qqnorm(tss); qqline(tss, col=2)

enter image description here

Tomando tss a ser una muestra de la distribución normal con parámetros de correlación:

ps <-pnorm(tss, mean(tss), sd(tss))

## top 10% students
(a <- rownames(ts[ps>0.9,]))

[1] "4"  "14" "23" "30" "39" "43" "45" "49" "50" "68" "69" "80"

Método B:

Tomar las puntuaciones z dentro de las pruebas, el informe de los valores de p de t unilateral pruebas dentro de los estudiantes.

z.ps <- function(ts) {
 zs <- scale(ts) 
 st <- apply(zs, 1, function(s) t.test(s, alternative='greater'))
 unlist(lapply(st, function(s) s$p.value))
}

ps <- z.ps(ts)

## top 10% students
(b <- rownames(ts[ps<0.1,]))

[1] "3"  "4"  "8"  "14" "23" "30" "39" "43" "45" "49" "50" "68" "69" "80" "83"
[16] "96"

Esto se traduce en una más "permisivo" umbral. Se trata de dar cuenta de la variabilidad en las pruebas dentro de los estudiantes, pero en la normal de la asunción es a veces cuestionable, incluso para las grandes n.

Ver aquí (gráfico no se muestran), y repita los métodos con diferentes m,n:

op <- par(mfrow=c(3,4))
for (i in sample(n,12)) { qqnorm(ts[i,]); qqline(ts[i,],col=2) }
par(op)

Esto es en parte debido a la forma en que estos datos son simulados. Tal vez no sea muy realista el modelo de "estudiante" habilidades como uniforme en un intervalo y no correlacionados dentro de los sujetos humanos.

El punto no es la defensa, o de otra manera, de la ingenuidad de la simulación. Sino más bien a reforzar la idea de que si su "estudiantes" son las métricas de rendimiento de la arbitrariedad de los procesos, los atributos de estos influirán en lo que constituye un enfoque sensato.

Espero que ayude.

1voto

jws121295 Puntos 36

Personalmente, no me gusta la premisa. Usted lo pidió, y yo trabajo con él, pero no me gusta la fundamental aquí.

Personal de lado en la enseñanza de

Yo, personalmente, creo que un profesor tiene 2 trabajos, y tampoco se ha mejorado por la ambigüedad:

  1. para enseñar y certificar que el estudiante tiene todos los fundamentos abajo. Si algo no es fundamental, entonces no lo necesitan. Si lo necesitan, entonces es fundamental. Cada estudiante pasar de una clase debe tener el 100% de los fundamentos abajo. Ningún estudiante pasar de una clase deben faltar en cualquier de los fundamentos - si carecen de ellos en caso de fallar la clase.
  2. enseñar al estudiante a aprender por si mismas. Con esto quiero decir que todos los métodos de aprendizaje son parte de los fundamentos. El estudiante que este es capaz de construir en todas las formas, en sus fundamentos arbitraria de los niveles de excepcionalidad. Ningún estudiante pasar de una clase debe ser capaz de aprender por sí mismo en cualquier forma. Cada estudiante pasar de una clase deben ser capaces de enseñar a sí mismos en todos y cada uno de las formas relevantes para el tema.

Cómo puedo ganar en el "Pick-em"

Puedo jugar a una versión de fantasía de fútbol llamado "pick-em". Mis resultados son al menos tan buena como la de Las Vegas "difundir" los valores.

El problema puede enunciarse como:

  • 16 equipos, y algunos de la historia reciente de cómo juegan (sólo tengo puntos por juego)
  • dado que dos de los 16 equipos que estará contenido en el siguiente juego
  • determinar cuál es la que más probabilidades de ganar
  • determinar una escala que indica cuánto más probable para ganar uno es que el otro

Mi planteamiento:

  • Establecer la métrica: Para todos los últimos juegos jugó el equipo, en caso de ganar indicar el punto diferencial como positivo, de lo contrario indicar como negativo
  • Establecer el sistema de coordenadas: Para el juego de interés, poner un equipo en la coordenada x=1, y la otra en x=-1. Cada uno de los diferenciales de las puntuaciones se convierte en un valor de y. Que significa en x=1 hay tantos puntos como los juegos que se han considerado relevantes de la historia. Si los últimos 5 juegos son considerados relevantes de la historia, a continuación, hay 5 puntos en x=1, lo que indica relevantes de la calificación de equipo de x=1 y hay 5 puntos en x=-1 indica relevantes de la calificación de equipo de x=-1.
  • utilice el Theil-Sen estimador (o sus familiares) para determinar la mediana pendiente entre todos los pares de puntos. Si la pendiente es positiva, entonces el equipo en x=1, va a ganar, de lo contrario el equipo en x=-1 va a ganar. La pendiente es una medida de la probabilidad de un equipo es ganar. Si la pendiente es poco profunda de la ganar-pérdida es incierto, pero si la pendiente es alta, entonces la ganar-pérdida es más fiable.

Que debo declinamos que todas las exenciones de responsabilidad de aplicar para que nadie me escribe mensajes de odio diciendo que perdió el dinero de apuestas utilizando este método. Si usted apuesta a continuación, es su decisión, no la mía.

Aplicar a los niños

Usted puede hacer una matriz (también conocido como gráfico) la comparación de todos los niños. en la celda (i,j) que compara kid "yo" frente a kid "j" poner la pendiente de la T-S estimador. Si kid "yo" normalmente gana, la pendiente es positiva, de lo contrario es negativo.

Hacer fila sumas. Que se va a dar un 1 eje para la estimación robusta de rendimiento. Un valor más alto de la fila suma significa que el estudiante en general es de mayor rendimiento. Un menor valor de la fila suma significa que el estudiante en general es de menor rendimiento. Va a ser el mejor estimador de la comparativa de rendimiento. Le dirá casi nada de rendimiento absoluto. Le dirá nada acerca de la reunión de los criterios que me dio. Será, sin embargo, ser un excelente estimador de rendimiento comparativo. Se permitirá la agrupación.

No es un libro de "reality check" para univariante de datos llamado 4-parcela. (enlace) Si desea cualquier sentido de lo que está pasando, a continuación, utilizar este. Se va a mostrar tendencias, valores atípicos, algo acerca de la dependencia del grado de kid "yo" frente a "i+1", y la naturaleza de la distribución. Hay mano saludando a decir en el límite de las infinitas muestras de todo es gaussiano. En realidad nada es gaussiano, ni siquiera números pseudo aleatorios significaba para buscar gaussiano. La verdadera distribución puede decir acerca de los clústeres, grumos, (probabilidad modos), y los valores atípicos.

La mejor de las suertes

PS: Si quieres ejemplo y el código fuente para el libro de texto TS (no es mi variante), a continuación, voy a proporcionar. Por favor solicite.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X