Tiene razón al sospechar que su profesor lo ha entendido mal.
La respuesta correcta es que no podemos decir nada en absoluto sobre el porcentaje de mejora del rendimiento de los alumnos impulsado por la experiencia de los profesores . Nada en absoluto.
¿Por qué? La cita es en términos de varianza explicada . La varianza explicada no tiene nada que ver con los valores reales sobre los que se miden las escalas, en los que se contabilizaría cualquier porcentaje de mejora del rendimiento de los alumnos. Ambas cosas están completamente separadas.
Veamos un ejemplo. Aquí hay algunos datos simulados:
![variance_explained]()
Código R:
nn <- 1e2
set.seed(1) # for reproducibility
teaching_expertise <- runif(nn)
student_achievement <- 5+0.1*teaching_expertise+rnorm(nn,0,0.05)
model <- lm(student_achievement~teaching_expertise)
plot(teaching_expertise,student_achievement,pch=19,las=1,
xlab="Teaching Expertise",ylab="Student Achievement")
abline(model,col="red")
Tenga en cuenta que el model
está correctamente especificado: el rendimiento de los alumnos depende linealmente de la experiencia docente, y eso es lo que estoy modelando. No hay trucos baratos aquí.
Tenemos $R^2=0.30$ por lo que la experiencia docente representa efectivamente el 30% del rendimiento de los alumnos ( ver aquí ):
> summary(model)
Call:
lm(formula = student_achievement ~ teaching_expertise)
... snip ...
Multiple R-squared: 0.304, Adjusted R-squared: 0.2969
Sin embargo, aquí está el rendimiento de los alumnos que predeciríamos para los profesores que se encuentran en la parte más baja (experiencia docente de 0) frente a los que se encuentran en la parte más alta del rango (1):
> (foo <- predict(model,newdata=data.frame(teaching_expertise=c(0,1))))
1 2
4.991034 5.106651
La mejora es del orden de $\frac{5.11-4.99}{4.99}\approx 2.4\%$ .
> diff(foo)/foo[1]
2
0.02316497
(Además, esto es esperado logro. Actual el logro será diferente. Dado que la regresión a la media suele ser más fuerte en los extremos, la diferencia real será aún menor).
¿Y sabes qué? Podríamos cambiar este porcentaje de cambio a casi cualquier número que queramos. Incluso un negativo ¡porcentaje de mejora! ¿Cómo? Simplemente cambiando ese único e inocuo número 5
en la simulación de datos anterior, es decir, el intercepto.
¿Qué está pasando? La varianza explicada mide la cantidad en la que los residuos (suma de cuadrados) son reducidos por un modelo es decir, la diferencia entre los residuos de la línea de regresión y los residuos de la media general. Al cambiar el intercepto (el 5
), podemos desplazar todo arriba y abajo. Incluyendo la media general. Así que cambiar el intercepto dejará la varianza explicada completamente sin cambios. (Si tienes R, prueba esto. Esperaremos).
Sin embargo, el cambio de todo hacia arriba y hacia abajo se cambiar las puntuaciones concretas. En particular, el porcentaje mejora de un "buen" frente a un "mal" profesor. Si desplazamos todo hacia abajo lo suficiente, obtenemos un negativo rendimiento de los alumnos para el "mal" profesor. Y un cambio positivo para el "buen" profesor frente a un negativo La línea de base le dará un porcentaje negativo de mejora. (Una vez más, pruebe esto. Un intercepto de -1
obras).
Sí, por supuesto que esas mejoras porcentuales negativas no tienen sentido aquí. Esto es sólo una ilustración del hecho de que hay cero relación entre la varianza explicada y el porcentaje de mejora de las mediciones .