Soy un completo principiante en el análisis de series temporales. Utilizo R. Entiendo que los datos de las series temporales deben ser estacionarios para realizar análisis como la correlación cruzada o el modelado.
Sin embargo, tengo problemas para determinar si mis datos son estacionarios. Tengo conjuntos de datos con mediciones de contaminación del aire por hora durante 2 semanas por conjunto de datos. Quiero analizar los datos por 2 semanas y por día.
No podría decir realmente, basándome en los gráficos normales, si los datos son estacionarios o no estacionarios.
He trazado los ACFs para 2 semanas y 1 día sin y con diferenciación.
Para el periodo de 2 semanas (el segundo gráfico son datos diferenciados).
Para un periodo de 1 día (el segundo gráfico son datos diferenciados).
Yo diría (con mis limitados conocimientos) que los primeros gráficos de ambos periodos no parecen estacionarios, sino que los datos diferenciados parecen ruido blanco.
He mirado un poco el test ADF y KPSS, pero mis conocimientos estadísticos no son muy grandes, así que no entiendo la teoría que hay detrás. Además, entiendo cómo elegir la k adecuada para la prueba ADF, pero al cambiar k vi que puedo hacer que el valor p sea inferior a 0,05 si elijo la k "correcta".
Mis preguntas son:
-
¿Los gráficos ACF de los datos no diferenciados son ya razón suficiente para diferenciar los datos (porque parecen no estacionarios)? (teniendo en cuenta que soy muy principiante y prefiero el método más fácil que sea aceptable..)
-
Si esto no es suficiente, ¿debo realizar también la prueba KPSS y ADF y, en caso afirmativo, cómo debo elegir la k para la prueba ADF?
EDITAR:
- Además, he intentado calcular la correlación cruzada (con
Ccf()
) y descubrí que los datos diferenciados tienen, en los pocos casos que probé, una correlación menor que los datos no diferenciados. Me interesaría entender por qué es así.
Gracias.
0 votos
stats.stackexchange.com/questions/263366/