No importa cuál sea el modelo, generalmente cuantos más datos tengas, mejor. Si deseas hacer un pronóstico, deseas que tu muestra sea lo suficientemente representativa para la población a medida que cambia. En la mayoría de los casos, solo tienes un conocimiento parcial sobre los cambios en el pasado y no tienes conocimiento sobre el futuro. Reunir más datos te ayuda a ganar más confianza en la previsibilidad de los cambios (esto está relacionado con la previsibilidad). Quieres encontrar un patrón repetitivo, una tendencia, o al menos describir el comportamiento aleatorio de tu proceso con algún modelo, por lo que necesitas estar seguro de que lo que observaste es de alguna manera similar a lo que posiblemente pueda suceder en el futuro.
Es posible hacer pronósticos de series temporales incluso con series temporales cortas (ver también el blog de Rob Hyndman), pero generalmente más datos significa más información y una muestra más representativa. Piensa en tu muestra en términos de observaciones de unidades de tiempo. Si tienes dos años de datos semanales, esto significa que solo tienes $2\times 52 = 104$ observaciones semanales. Si deseas hacer un pronóstico medio año antes, entonces debes considerar el hecho de que solo tienes cuatro medios años en tus datos.
Imagina que trabajas con datos de clima y deseas hacer un pronóstico medio año antes sobre la temperatura. Hay una estacionalidad notable en la temperatura, por ejemplo, en el centro de Inglaterra la temperatura parece aumentar en la primera mitad del año y disminuir en la segunda mitad (Parker et al, 1992). Si tuvieras dos años de datos sobre fluctuaciones de temperatura y quisieras hacer un pronóstico medio año antes sobre la temperatura entre enero y junio, entonces solo dos de los cuatro medios años de tus datos serían relevantes debido a la estacionalidad (los datos sobre la disminución de la temperatura en la segunda mitad del año no te proporcionarían mucha información sobre el aumento en la primera mitad).
(fuente http://www.metoffice.gov.uk/hadobs/hadcet/cetml1659on.dat)
Si hay ciclos o estacionalidad (como con los datos de temperatura) que puedas asumir que se repetirán en el futuro o una tendencia que continuará en el futuro, entonces los datos que "capturan" este patrón pueden ser suficientes. Sin embargo, el patrón puede cambiar, considera por ejemplo el conjunto de datos de cobre de la biblioteca R fma. Mirando solo los datos hasta el año 1920 te llevaría a conclusiones totalmente diferentes que mirando los datos después de este año (incluso el precio promedio difiere).
En el caso de datos multivariables, estás observando los cambios de varias variables a lo largo del tiempo, por lo que debes considerar si tienes suficiente información sobre cada una de las variables. Como ejemplo, utilicemos los datos de banco de la biblioteca fma que describe depósitos en un banco de ahorros mutuos en un área metropolitana grande con tres variables disponibles: saldo de fin de mes (EOM), tasas de bonos AAA compuestos (AAA) y bonos del gobierno de EE. UU. a 3-4 años (threefour). Como se puede ver en el gráfico publicado a continuación, tanto las variables individuales como sus relaciones mutuas cambian con el tiempo.
Antes de construir tu modelo, debes considerar si tienes suficiente información sobre los cambios a lo largo del tiempo en tus variables y sobre sus relaciones mutuas. La respuesta a la pregunta de si tienes suficientes datos para tu horizonte de pronóstico desafortunadamente depende en gran medida de cuáles sean tus datos (ver Ventana de pronóstico óptima para series de tiempo). También debes recordar que a veces una parte corta de la serie de tiempo puede sugerir algún patrón (por ejemplo, una clara tendencia al alza de AAA en los datos del banco antes del tiempo 30) que no es tan obvio o inexistente a largo plazo. Reunir más datos, en la mayoría de los casos, te ayuda a construir una mayor confianza sobre el comportamiento del patrón que observas a lo largo del tiempo.
Parker, D.E., Legg, T.P., and Folland, C.K. (1992). Una nueva serie diaria de temperatura central de Inglaterra, 1772–1991. International Journal of Climatology, 12(4), 317-342.