1 votos

Regresión múltiple: La medida de fuerza cambia según el alumno, pero es constante a lo largo del tiempo

Descargo de responsabilidad: Es la primera vez que utilizo este foro, por lo que le ruego que me indique si mi pregunta no es clara o si necesita más información.

Tengo datos que se ven así:

enter image description here

Quiero ejecutar la regresión:

lm(formula = SCORE ~ STRENGTH, data = mydata) para averiguar si una mayor FUERZA del alumno (NOMBRE) conduce a una mayor puntuación en el examen.

Tenga en cuenta que la puntuación de STRENGTH cambia según el alumno, pero es constante a lo largo del tiempo. Me preguntaba si esta configuración de la regresión es válida, o si el hecho de que no tenga variación temporal es un problema en una regresión de series temporales. ¿Me permitiría esto probar si una mayor fuerza explica o no una mayor puntuación en los exámenes?

Muchas gracias por su ayuda y sugerencias.

Glenn

1voto

eli Puntos 26

El código lm(formula = SCORE ~ STRENGTH, data = mydata) supone que los datos concuerdan con el siguiente modelo ( $Y=$ puntuación y $X = $ fuerza) $$Y_i = \beta_0 + \beta_1 \cdot x_i+\epsilon_i$$ donde el $\epsilon_i$ son independientes y $\mathrm{Var}[\epsilon_i] = \sigma^2$ . Le gustaría comprobar si $\beta_1 > 0$ .

Yo diría que los supuestos parecen poco razonables en tu caso, ya que las muestras no son independientes. Creo que las estimaciones por mínimos cuadrados siguen siendo insesgadas, pero la estimación de la varianza de $\hat \beta_1$ no lo hará.

Creo que se podría entender el tema haciendo el escenario más extremo. Digamos que tienes 100 muestras de la fuerza y la puntuación de Bob, y una muestra de la fuerza y la puntuación de Jim. Si ignoras este hecho y realizas una regresión lineal, la estimación puntual de $\beta_1$ podría estar en lo cierto, pero la estimación de la varianza estaría muy subestimada.

He probado algunos códigos y no creo que puedas detectar una diferencia significativa (o un aumento)...

m <- matrix(c(0.81,0.67,0.98,0.23,0.17,0.38,0.49,0.11,0.73,0.27,0.51,0.3,0.5,0.8,0.5,0.5,0.8,0.3,0.3,0.5,0.3,0.8),ncol=2)
m <- as.data.frame(m)
m <- cbind.data.frame(m,c("M","J","B","J","J","B", "M", "M","J", "M","B"))
colnames(m) <- c("score","strength","name")
m

lm.fit <- lm(score~strength,data=m)
summary(lm.fit) #2 sided test unable to reject the null

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X