6 votos

¿Por qué no podemos utilizar métodos descendentes en la previsión de series temporales agrupadas?

Como pregunté en aquí Estaba tratando de pronosticar series temporales agrupadas con dos variables de agrupación y encuentro algunas limitaciones de los métodos de previsión jerárquica. En particular, el uso de hts de R, no podemos utilizar métodos descendentes.

Considero series temporales agrupadas que pueden verse como:

     Total
   |       | 
   A       B
 |   |    |   |
AX  AY   BX  BY

     Total
   |       | 
   X       Y
 |   |   |   |
 AX  BX  AY  BY

(Se describe con más detalle en este Correo electrónico: y por ejemplo en este papel )

Según la notación especificada en este documento podemos escribir estas series temporales agrupadas como $\mathbf{Y_t} = \mathbf{S} \mathbf{Y_{K,t}}$ , donde $\mathbf{S}$ es una matriz sumatoria y $\mathbf{Y_{K,t}}$ es un vector de series de nivel inferior (que según la suposición del paquete hts tienen que ser iguales). En este caso se ve así:

$$ \begin{bmatrix} Y_t \\ Y_{A,t} \\ Y_{B,t} \\ Y_{X,t} \\ Y_{Y,t} \\ Y_{AX,t} \\ Y_{AY,t} \\ Y_{BX,t} \\ Y_{BY,t} \\ \end{bmatrix} = \begin{bmatrix} 1 & 1 & 1 & 1 \\ 1 & 1 & 0 & 0 \\ 0 & 0 & 1 & 1 \\ 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 1 \\ 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ \end{bmatrix} \begin{bmatrix} Y_{AX,t} \\ Y_{AY,t} \\ Y_{BX,t} \\ Y_{BY,t} \\ \end{bmatrix} $$

La previsión revisada (lo que estoy buscando) puede escribirse como $\mathbf{\tilde{Y}_n(h) = SP\hat{Y}_n(h)}$ y en el caso de la matriz del método top-down $\mathbf{P}$ se define como $\mathbf{P} = \begin{bmatrix} \mathbf{p} | \mathbf{0}_{m_K \times (m-1)} \end{bmatrix}$ , donde $ \mathbf{p} = [p_1, p_2, ..., p_{m_K}]^T$ es un vector de proporciones. Sin entrar en más detalles, en este ejemplo $m_K = 4$ y $m=9$ Así que $\mathbf{P} = \begin{bmatrix} \mathbf{p_1} & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ \mathbf{p_2} & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ \mathbf{p_3} & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ \mathbf{p_4} & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ \end{bmatrix}$

y las previsiones revisadas pueden escribirse como

$$ \begin{bmatrix} \tilde{Y_t} \\ \tilde{Y}_{A,t} \\ \tilde{Y}_{B,t} \\ \tilde{Y}_{X,t} \\ \tilde{Y}_{Y,t} \\ \tilde{Y}_{AX,t} \\ \tilde{Y}_{AY,t} \\ \tilde{Y}_{BX,t} \\ \tilde{Y}_{BY,t} \\ \end{bmatrix} = \begin{bmatrix} 1 & 1 & 1 & 1 \\ 1 & 1 & 0 & 0 \\ 0 & 0 & 1 & 1 \\ 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 1 \\ 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ \end{bmatrix} \begin{bmatrix} p_1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ p_2 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ p_3 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ p_4 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ \end{bmatrix} \begin{bmatrix} \hat{Y_t} \\ \hat{Y}_{A,t} \\ \hat{Y}_{B,t} \\ \hat{Y}_{X,t} \\ \hat{Y}_{Y,t} \\ \hat{Y}_{AX,t} \\ \hat{Y}_{AY,t} \\ \hat{Y}_{BX,t} \\ \hat{Y}_{BY,t} \\ \end{bmatrix} $$

y después de los cálculos:

$$ \begin{bmatrix} \tilde{Y_t} \\ \tilde{Y}_{A,t} \\ \tilde{Y}_{B,t} \\ \tilde{Y}_{X,t} \\ \tilde{Y}_{Y,t} \\ \tilde{Y}_{AX,t} \\ \tilde{Y}_{AY,t} \\ \tilde{Y}_{BX,t} \\ \tilde{Y}_{BY,t} \\ \end{bmatrix} = \begin{bmatrix} p_1\hat{Y_t} + p_2\hat{Y_t} + p_3\hat{Y_t} + p_4\hat{Y_t} \\ p_1\hat{Y_t} + p_2\hat{Y_t} \\ p_3\hat{Y_t} + p_4\hat{Y_t} \\ p_1\hat{Y_t} + p_3\hat{Y_t} \\ p_2\hat{Y_t} + p_4\hat{Y_t} \\ p_1\hat{Y_t} \\ p_2\hat{Y_t} \\ p_3\hat{Y_t} \\ p_4\hat{Y_t} \\ \end{bmatrix} $$

Lo cual me parece bien. Esperaba que alguien pudiera señalar por qué este método no puede utilizarse en la previsión de series temporales agrupadas y señalar cuando mis cálculos son erróneos?

4voto

Senseful Puntos 116

Los métodos descendentes aplicados en el hts fueron diseñados para series temporales jerárquicas. Si quiere definir su propio método descendente para algunas series temporales no jerárquicas, adelante. No está mal, sólo que no se ha implementado en el hts paquete porque hay soluciones mucho mejores para el problema.

El mejor enfoque disponible actualmente es utilizar los mínimos cuadrados ponderados como se explica en http://robjhyndman.com/working-papers/hgts/ . Este es el valor por defecto en el hts paquete.

1 votos

Muchas gracias por su respuesta. Definitivamente aclara el uso del método de previsión descendente en el caso de las series temporales agrupadas. ( hts es una gran contribución en las aplicaciones prácticas)

2voto

icelava Puntos 548

Además de La respuesta de Rob veamos su ejemplo concreto:

     Total
   |       | 
   A       B
 |   |    |   |
AX  AY   BX  BY

     Total
   |       | 
   X       Y
 |   |   |   |
 AX  BX  AY  BY

No tienes uno, sino dos jerarquías. Por ejemplo, la superior puede agrupar las ventas a nivel de producto-ubicación primero por ubicación A y B y luego sumarlas para obtener el Total, y la segunda puede agrupar primero por producto X e Y y sumarlos.

Para hacer una previsión descendente, se prevé el Total y luego se desglosa por proporciones. Puede utilizar proporciones históricas, en cuyo caso, sí, puede hacerlo.

El problema surge si se quiere utilizar previsión proporciones para desglosar las previsiones totales. ¿Por qué? Porque si pronostica sus series de componentes A, B, X, Y por separado, estos pronósticos normalmente no serán consistentes con la suma. Es decir, si primero desglosa el Total en A y B y luego desglosa A en AX y AY, puede obtener un resultado diferente para AX que si primero desglosa X e Y y luego desglosa X en AX y BX.

Por lo tanto, tendrá que hacer algún tipo de conciliación. Y entonces, como Rob escribe También podría utilizar el enfoque de conciliación óptimo "real".

(Tenga en cuenta que este problema no se produce si utiliza histórico proporciones para desglosar las previsiones, ya que éstas son automáticamente coherentes. Sin embargo, las proporciones históricas no permiten pronosticar las dinámicas cambiantes de la jerarquía, como la evolución de las cuotas de mercado).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X