11 votos

¿Cuál es el trato con la autocorrelación?

Escribir el prólogo de esta, tengo una muy profunda experiencia en las matemáticas, pero en realidad nunca he tratado con series de tiempo, o de modelos estadísticos. Así que usted no tiene que ser muy suave conmigo :)

Estoy leyendo este artículo sobre el modelado de uso de energía en edificios comerciales, y que el autor hace esta afirmación:

[La presencia de autocorrelación surge] porque el modelo ha sido desarrollado a partir de datos de series de tiempo de uso de la energía, que es intrínsecamente autocorrelated. Cualquier puramente determinista del modelo de datos de series de tiempo se han de autocorrelación. La autocorrelación se encuentra a reducir, si [más los coeficientes de Fourier] se incluyen en el modelo. Sin embargo, en la mayoría de los casos, el modelo de Fourier tiene una baja C. V. El modelo por lo tanto, puede ser aceptable para los efectos prácticos que tiene (sic) no demanda una alta precisión.

0.) ¿Qué significa "cualquier puramente determinista del modelo de datos de series de tiempo se han autocorrelación"? Vagamente puede entender lo que esto significa, por ejemplo, cómo se puede esperar para predecir el siguiente punto en la serie de tiempo si usted tenía 0 autocorrelación? Esto no es un argumento matemático, para estar seguro, que es por qué esto es 0 :)

1.) Yo estaba bajo la impresión de que la autocorrelación básicamente mató a su modelo, pero pensando en ello, no puedo entender por qué esto debería ser el caso. Entonces, ¿por qué es de autocorrelación de una mala (o buena) cosa?

2.) La solución que he escuchado para tratar con autocorrelación es diff de la serie de tiempo. Sin tratar de leer la mente del autor, ¿por qué uno no hacer un diff si no despreciable de autocorrelación existe?

3.) ¿Qué limitaciones no despreciable de las autocorrelaciones lugar en un modelo? Se trata de una presunción en algún lugar (es decir, una distribución normal de los residuos cuando el modelado de regresión lineal simple)?

De todos modos, lo siento si estas son preguntas básicas, y gracias de antemano por su ayuda.

7voto

Andrew Puntos 126
  1. Yo creo que el autor es probablemente hablando de los residuos del modelo. Sostengo esto porque de su declaración acerca de la adición de más coeficientes de fourier; si, como yo creo, él es el ajuste de un modelo de fourier, a continuación, agregar más coeficientes reducir la autocorrelación de los residuos, a expensas de una mayor CV.

    Si tiene problemas para visualizar esto, piense en el siguiente ejemplo: supongamos que usted tiene los siguientes 100 puntos de conjunto de datos, que viene de dos coeficientes de fourier modelo con addeded blanco de ruido gaussiano:

    Datapoints

    El siguiente gráfico muestra dos ajustes: uno hecho con 2 coeficientes de fourier, y hecho con 200 coeficientes de fourier:

    Fits

    Como se puede ver, los 200 coeficientes de fourier ajusta a los puntos de datos mejor, mientras que el 2 coeficiente de ajuste (el "real" del modelo) se ajusta al MODELO mejor. Esto implica que la autocorrelación de los residuos del modelo con 200 coeficientes casi con toda seguridad se acerca a cero en todos los gal de los residuos de la 2 coeficiente de modelo, debido a que el modelo con 200 coeficientes de ajuste exactamente a casi todos los puntos de datos (es decir, los residuos que serán casi todos los ceros). Sin embargo, ¿qué haría usted piensa que va a pasar si sale, digamos, 10 puntos de datos de la muestra y ajuste de los mismos modelos? El 2-coeficiente de modelo predice mejor los puntos de datos que batientes de la muestra! Por lo tanto, va a producir una menor CV error como contrarios a los 200-coeficiente de modelo; esto se llama el sobreajuste. La razón detrás de esta 'magia' es porque lo CV realidad se trata de medir es el error de predicción, es decir, qué tan bien el modelo predice los puntos de datos no en el conjunto de datos.

  2. En este contexto, la autocorrelación en los residuos es "malo", porque esto significa que usted no está modelado de la correlación entre los puntos de datos lo suficientemente bien. La razón principal por la que la gente no diferencia la serie es porque realmente quieren modelo el proceso subyacente como es. Una de las diferencias de la serie de tiempo por lo general para deshacerse de periodicidades o tendencias, pero si que la periodicidad o la tendencia es en realidad lo que están tratando de modelo, luego de diferenciación pueden parecer como una opción de último recurso (o una opción con el fin de modelar los residuos con un más complejo proceso estocástico).
  3. Esto realmente depende de la zona que se está trabajando. Podría ser un problema con el modelo determinista. Sin embargo, dependiendo de la forma de la autocorrelación, se puede ver fácilmente cuando la autocorrelación surge debido a, por ejemplo, el parpadeo de ruido, ARMA-como el ruido o si es un residual subyacente fuente periódica (en el que caso de que usted tal vez desee aumentar el número de coeficientes de fourier).

2voto

Silvercode Puntos 438

He encontrado este documento"Regresiones Espurias en Econometría' útil cuando se trata de conseguir mi cabeza alrededor de por qué la eliminación de las tendencias es necesario. Esencialmente, si dos variables están en tendencia, a continuación, van a co-varían, lo cual es una receta para los problemas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X