la regresión lineal predice un nivel inferior al esperado

Question

la regresión lineal predice un nivel inferior al esperado

Preguntado el 20 de Diciembre, 2018: Cuando se hizo la pregunta
106 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Estoy tratando de predecir el GPA del primer trimestre para los estudiantes universitarios en base a una serie de factores de entrada (gpa de la escuela secundaria, prueba de nivel, año). Este no es el modelo general sino uno más simple. Las notas del primer trimestre están en el intervalo de 0 a 4, sin embargo las predicciones del modelo lineal OLS (estoy usando sklearn) nunca van más allá de 3,6 (ver imagen). ¿Se trata de algún tipo de problema que se me escapa? Ciertamente, hay datos en el conjunto de entrenamiento con el primer término GPA que está entre 3,6 y 4,0. No esperaba un rendimiento perfecto, pero esto es impar para mí.

Preguntado el 20 de Diciembre, 2018 por david

1 votos

¿Puede mostrarnos los gráficos de diagnóstico del modelo?

Comentado el 21 de Diciembre, 2018 por roberto

0 votos

Creo que la distancia de los cocineros es incorrecta porque tuve que calcularla yo mismo porque no encontré ninguna función fuera de statsmodels que la implemente y no he escrito pruebas o comparado con la salida de R, statsmodels, etc.

Comentado el 21 de Diciembre, 2018 por david

0 votos

Sólo con mirar el primer gráfico (de diagnóstico) puede ver que su modelo es fu****. Su variable dependiente está limitada a 0 y 4, por lo que un modelo lineal normal no es válido. Busque la regresión beta. Además, ¿tiene medidas repetidas en sus datos? Es decir, ¿algunos estudiantes tienen más de una puntuación? ¿Hay algún tipo de correlación?

Comentado el 21 de Diciembre, 2018 por roberto

Mostrar 1 comentarios más

Answer 1

1 Respuestas

Answer 2

3voto

George Puntos 191

Las predicciones de este tipo no incluyen el "error" de tu modelo: es decir, esperas que aunque tu modelo sea muy bueno, un alumno con alguna combinación de predictores no sea exactamente la predicción, sino que esté por encima o por debajo. La única forma de obtener una predicción de 4 sería si una combinación de predictores diera una estimación que el promedio de GPA para esa combinación observada sería 4. Si el promedio de GPA para esa combinación observada es de 3,6 con un rango de 3,0-4,0, su modelo predeciría 3,6 incluso si esperara que alguna fracción tuviera 4,0; su mejor conjetura para cada estudiante individual es el valor esperado la media. Si en lugar de eso, imaginó sus predicciones como distribuciones de probabilidad encontrarías que estos incluyen 4.0.

Sin embargo, parece que su modelo en sí no es muy bueno: hay mucha diferencia entre sus predicciones y los resultados y muy poca pendiente entre ellos en relación con la varianza.

Respondido el 20 de Diciembre, 2018 por George (191 Puntos )

0 votos

Sí, estoy de acuerdo en que el modelo no es muy bueno. Supongo que me quedé atascado en el valor máximo de predicción, y preguntándome por qué no sería más alto que tratar de afinar en algo que sea predictivo.

Comentado el 21 de Diciembre, 2018 por david

0 votos

@Krause Me hace mucha falta una cita formal del argumento que expones claramente, sobre que la varianza de las predicciones es menor que la de las obs. Me he esforzado por encontrar un documento(s) pero hasta ahora sin éxito. ¿Sugerencias, por favor? ¿Tiene el concepto un nombre en el que pueda buscar? Gracias.

Comentado el 5 de Febrero, 2021 por Martin

la regresión lineal predice un nivel inferior al esperado

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

la regresión lineal predice un nivel inferior al esperado

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: