Soy principiante y estoy tratando de entender lo que muestra un gráfico de autocorrelación.
He leído varias explicaciones de diferentes fuentes como este o la página página de Wikipedia relacionada entre otros que no cito aquí.
Tengo este código muy simple, donde tengo fechas en mi índice para un año y los valores son simplemente incrementando de 0 a 365 para cada índice.. ( 1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365
)
import numpy as np
import pandas as pd
from pandas.plotting import autocorrelation_plot
import matplotlib.pyplot as plt
dr = pd.date_range(start='1984-01-01', end='1984-12-31')
df = pd.DataFrame(np.arange(len(dr)), index=dr, columns=["Values"])
autocorrelation_plot(df)
plt.show()
donde se imprimirá el gráfico
Puedo entender y ver por qué el gráfico parte de 1.00
desde entonces:
Autocorrelación con retardo cero siempre la autocorrelación entre cada término y sí mismo. Valor y valor con siempre serán iguales.
Esto está muy bien, pero ¿por qué este gráfico en lag 50 tiene un valor en torno a 0,65, por ejemplo? ¿Y por qué cae por debajo de 0? Si no hubiera mostrado el código que tengo, ¿sería posible deducir que este gráfico de autocorrelación muestra una serie temporal de valores crecientes? Si es así, ¿podría intentar explicarle a un principiante cómo deducirlo?