1 votos

previsión del flujo de caja futuro a partir de datos anteriores

Dados estos datos de la serie temporal:

tbl <- tibble(month = c('jan', 'feb', 'march', 'april'),
          mob1 = c(20, 24, 27, 25),
          mob2 = c(15, 17, 19, NA),
          mob3 = c(11, 12, NA, NA),
          mob4 = c(8, NA, NA, NA))

Me gustaría predecir los valores de cada una de las NA. La previsión de cada mes debe basarse en los datos disponibles para ese mes concreto, y también en los patrones presentes en los demás meses. ¿Existe alguna técnica analítica que pueda utilizar para realizar estas predicciones? En realidad, mis datos son mucho más amplios que los del ejemplo dado.

EDITAR: DESCRIPCIÓN DE LOS DATOS REALES

Los datos reales constan de 39 meses de datos (por tanto, 39 columnas), para cada mes desde mediados de 2013 hasta la actualidad (55 + filas). El conjunto de datos se compone de datos de reembolso de préstamos. En concreto, el porcentaje de un préstamo que se devuelve cada mes hasta que se devuelve la totalidad del préstamo. Los casos, (filas) consisten en la suma del coste de todos los préstamos que se dispersaron en ese mes, luego las columnas mob1...mob39 consisten en el porcentaje de la cantidad dispersada en ese mes que se reembolsa. Por ejemplo, el porcentaje de todos los préstamos distribuidos en enero de 2014 podría ser del 3,3% al cabo de un mes, luego del 3,1% al cabo de dos meses, y así sucesivamente hasta el final del plazo del préstamo, y en teoría todos los porcentajes suman el 100%. En realidad, el porcentaje que se reembolsa cada mes disminuye gradualmente, empezando por un 3,5% en el mes 1 hasta un 1,3% en el mes 39 (de media), por lo que no hay estacionalidad en los datos, sino que cada caso tiene un porcentaje gradualmente decreciente del importe total del préstamo a lo largo de los 39 meses.

Mi búsqueda en Internet muestra que el modelo ARIMA es algo que podría utilizar (¡al menos eso es lo que sigue apareciendo!), sin embargo, mis datos no tienen estacionalidad y por lo tanto ARIMA podría ser una solución demasiado complicada, y por lo que entiendo el modelo ARIMA no aprovecha los patrones presentes en diferentes casos para predecir los NA en dicho caso. Lo que quiero decir con esto es que, por ejemplo, me gustaría predecir los meses de NA para febrero, utilizando no sólo los datos existentes para febrero, sino también los datos de la serie temporal anterior de enero, ya que ambos muestran patrones similares. No estoy seguro de si esto es una práctica común, pero me parece intuitivo hacerlo.

¡Cualquier ayuda que se pueda dar será muy apreciada!

2voto

user185038 Puntos 76

No hay muchos datos aquí, así que obtendrás una respuesta bastante genérica.

Si sus datos son una serie temporal (relacionada consigo misma a lo largo del tiempo), existen métodos para identificar tendencias y estacionalidad o ciclos que ayudan a la predicción. Compruébelo: https://otexts.org/fpp2/ para un montón de técnicas.

Si sus datos no son una serie temporal (no se relacionan consigo mismos y sólo con otras variables), o si se puede utilizar otra variable como alias del tiempo, entonces puede utilizar una técnica más sencilla como la regresión lineal simple.

1voto

netbook shopper Puntos 11

Si tiene una gran cantidad de registros históricos, no sólo 4 meses, sino varios meses de historia, podría utilizar autoregresión vectorial para modelar estos datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X