1 votos

¿Qué puede deducirse de una serie temporal corta multivariante?

Dispongo de observaciones anuales de 24 variables a lo largo de 10 años, y me gustaría identificar indicios de cambio estructural (cambio de régimen). Los datos se refieren a la matrícula y el gasto universitarios, por lo que espero que las variables sean estacionarias en cuanto a la tendencia y busco cambios en las tendencias lineales.

Lo que me preocupa es que el número de observaciones parece demasiado pequeño para identificar un cambio de régimen con certeza, pero espero que haya una forma de compensarlo utilizando el gran número de variables. Muchas de las variables están muy correlacionadas, así que he pensado en el ACP para reducir la dimensionalidad, pero no sé cómo evaluar la certeza estadística (por ejemplo, con la prueba de Chow).

Aquí encontrará una versión normalizada de los datos en formato CSV:

https://www.dropbox.com/s/7z9b5n5exq2j6t5/standardized.csv?dl=0

Edito: busco métodos generales que puedan ser útiles en un caso así, no un análisis de este archivo de datos en concreto (que se incluyó sólo a petición).

1voto

Owen Fraser-Green Puntos 642

El problema al que se enfrenta es doble: 1. tiene que encontrar el subconjunto de 19 predictores que mejor se "relacione" con la serie de interés y 2. para ese subconjunto de series, averiguar qué estructura contemporánea y de retardo se necesita para cada uno de los candidatos seleccionados Y luego averiguar (descubrir) mediante procedimientos de detección de intervención si se puede identificar algún impulso/cambio de nivel/cambio de tendencia . ¿Por qué no publica sus datos y le ayudo? Otros también podrían intentarlo utilizando su propia experiencia/software. Sus 10 observaciones supondrán un reto tanto para mí como, estoy seguro, para otros lectores.

UNA VEZ RECIBIDOS SUS DATOS:

Estas 23 características. cada una con 10 valores se sometieron a AUTOBOX para que expertos en análisis de series temporales determinaran la ecuación subyacente y la actividad excepcional (cambios estructurales). Su pregunta sobre el cambio estructural o de régimen sólo puede responderse mediante la formación de una ecuación ARIMA y la identificación de cuatro tipos de intervenciones (impulsos, cambios de nivel, impulsos estacionales y tendencias temporales locales). Con 10 valores, AUTOBOX se limitaba a buscar sólo los impulsos. He guardado un archivo zip (que contiene sólo 18 de los 23, ya que en 5 no se detectaron intervenciones) llamado http://www.autobox.com/stack/23.zip . En general, los cambios estructurales pueden deberse a posibles cambios en los parámetros del modelo a lo largo del tiempo, cambios en la varianza del error a lo largo del tiempo o cambios en el nivel o la pendiente. Un impulso es un cambio instantáneo de nivel.

1voto

Aksakal Puntos 11351

He descargado tus datos y he ejecutado el ACP. Volvió con 9 componentes. Tenga en cuenta, que el rango de su matriz es 9, no 10. Tiene que haber algunas dependencias lineales, que no nos revelaste. No sabemos cuales son tus columnas, tal vez algunas columnas son totales de subconjuntos de otras columnas, etc.

En cualquier caso, echa un vistazo a los siguientes gráficos. El superior muestra la serie a lo largo del tiempo, y el inferior muestra 9 componentes PCA. En el gráfico superior se puede ver que varias series parecen estar creciendo, mientras que algunas están estacionarias.

El gráfico inferior muestra que sólo crece el primer componente del ACP, que explica el 60% de la variación. Los demás no parecen cambiar mucho. Puede realizar pruebas estadísticas si lo desea, pero en mi opinión no tiene sentido dado el tamaño de la muestra. No podrás extraer más información que de los gráficos. No hay indicios de ruptura estructural. No podrá probarlo para el conjunto de datos. Puedes intentar ir a por una o dos series, basándote en el conocimiento del dominio, por supuesto. Sin embargo, dudo que consigas nada. Ninguno de los componentes del ACP presenta una ruptura evidente.

enter image description here

Código MATLAB

[coeff,score,latent,tsquared,explained,mu] = pca(standardized);

subplot(2,1,1)
plot(standardized)
title 'Series'
legend('location','Best')

subplot(2,1,2)
plot(score)
title 'PCA components'
legend('location','Best')

rank(standardized)
explained

SALIDA

ans =

     9

explained =

   60.8074
   13.8883
    7.9533
    6.0521
    4.5944
    3.5775
    1.8449
    0.8761
    0.4060

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X