5 votos

Lo que podría causar un residual de la trama para ser enteramente por encima de 0?

Lo que podría causar un modelo de regresión para siempre bajo predecir?

Durante más de un año ahora un asociado de la mina ha sido la producción de un modelo lineal para un cliente, el cual predice las tendencias con una exactitud razonable, pero siempre bajo predice la magnitud.

Esto me ha molestado durante un tiempo y cada vez que lo veo o conseguir recuerda que yo intento para encontrar la causa y a la vez corto.

EDIT: Leyendo los comentarios me di cuenta de que me misspoke. En lugar de los residuos 'siempre' ser sesgada de la agregación de la modelo siempre está debajo de la real. No estoy seguro de cómo recuperar correctamente excepto la culpa de café/dormir etc. Lo que yo quería preguntar es más cercana a esta, para cada mes, la suma de los resultados reales es mayor que el de la predicción de los resultados de 'cada' vez.

11voto

Charan Puntos 11

Para resumir los diversos comentarios y respuestas hasta el momento:

  1. Si las predicciones son datos que no era parte de la formación de ejemplo, podría haber una diferencia sistemática entre los datos de entrenamiento y los datos de la predicción. Por ejemplo, si usted está montando datos de series de tiempo y los datos que contiene un ascendente de la curva de tendencia, entonces predecir el futuro a partir del pasado con un modelo lineal producirá bajo-predicciones en promedio.

  2. Si el modelo siempre bajo-predice en los datos de entrenamiento (o incluso sólo en promedio), podría ser menos frecuentes en la variedad de modelo lineal, tal como un cuantil modelo de regresión; o puede que no contienen una intercepción (o términos que pueden linealmente se combinan para formar una intercepción).

  3. Si el modelo es lineal estándar de mínimos cuadrados y contiene una intercepción o equivalente, que abarca los términos, luego Benjamín del post es correcto. El fenómeno observado usted no puede suceder. Así que debe haber un error en el cómputo de código utilizado para el modelo de formación o de predicción.

4voto

zoldsegzizi Puntos 1

Vamos a suponer que la regresión lineal de ajuste es a través de mínimos cuadrados, contiene una intercepción, y el resto de la trama es que a partir de los datos de entrenamiento.

De la normal de ecuaciones, vemos que los residuos de la regresión tiene la media de la muestra 0. Por lo tanto, no es posible que el residual de la trama para ser enteramente por encima de 0. Debe haber un error en alguna parte en la visualización/computación.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X