La cuestión aquí es llegar a una ecuación que analice los datos observados en función de la señal y el ruido. Si los datos son sencillos, el enfoque de regresión puede funcionar. Hay que tener cuidado para entender algunos de los supuestos que están haciendo con Prophet. Debería entender mejor lo que hace Prophet, ya que no se limita a ajustar un modelo simple, sino que intenta añadir algo de estructura.
Por ejemplo, algunas reflexiones que hice después de leer su bien redactada introducción podrían ayudarte en tu evaluación. Pido disculpas de antemano si he entendido mal su planteamiento, y me gustaría que me corrigieran si es así.
1) Su ejemplo principal tiene dos puntos de ruptura en la tendencia, pero sólo capturaron el más obvio.
2) Ignoran cualquier estructura ARIMA que refleje series estocásticas omitidas o el valor de utilizar valores históricos de Y para guiar la previsión.
3) Ignoran cualquier posible dinámica (efectos de adelanto y retraso) de las series estocásticas y deterministas sugeridas por el usuario. Los efectos de regresión causal de Prophet son simplemente contemporáneos.
4) No se intenta identificar los cambios de escalón/nivel en las series o los pulsos estacionales, por ejemplo, un cambio en el EFECTO LUNES a mitad de tiempo debido a algún acontecimiento externo desconocido. Prophet asume un "crecimiento lineal simple" en lugar de validarlo examinando posibilidades alternativas. Para un posible ejemplo de ello, véase Previsión de pedidos recurrentes para un negocio de suscripción en línea utilizando Facebook Prophet y R
5) Los senos y cosenos son una forma opaca de tratar la estacionalidad, mientras que los efectos estacionales como el día de la semana, el día del mes, la semana del mes, el mes del año son mucho más efectivos/informativos cuando se trata de efectos antropogénicos (¡tratando con humanos!).
Sugerir frecuencias de 365,25 para patrones anuales no tiene mucho sentido porque no realizamos la misma acción exactamente el mismo día que el año pasado, mientras que la actividad mensual es mucho más persistente, pero Prophet no parece ofrecer la opción de 11 indicadores mensuales. Las frecuencias semanales de 52 tienen poco sentido porque no tenemos 52 semanas en todos los años.
6) No se intenta validar que los procesos de error sean gaussianos para poder realizar pruebas de significación significativas.
7) No hay preocupación por que la varianza del error del modelo sea homogénea, es decir, que no cambie de forma determinista en puntos concretos del tiempo que sugieren los mínimos cuadrados ponderados. No hay preocupación por encontrar una transformada de potencia óptima para que la varianza del error sea proporcional al Valor Esperado ¿Cuándo (y por qué) hay que tomar el logaritmo de una distribución (de números)? .
8) El usuario tiene que especificar previamente todos los posibles efectos de adelanto y retraso en torno a los eventos/festividades. Por ejemplo, las ventas diarias suelen empezar a aumentar a finales de noviembre, lo que refleja un efecto a largo plazo de la Navidad.
9) No se preocupan de que los errores resultantes estén libres de estructura sugiriendo formas de mejorar el modelo mediante la comprobación del diagnóstico de suficiencia.
10) Aparentemente no hay preocupación por mejorar el modelo eliminando la estructura no significativa.
11) No es posible obtener una familia de previsiones simuladas en las que los límites de confianza no sean necesariamente simétricos, mediante el bootstrapping de los errores del modelo con la previsión de posibles anomalías.
12) Dejar que el usuario haga suposiciones sobre las tendencias (el número de puntos de ruptura de la tendencia y los puntos de ruptura reales) permite una flexibilidad no deseada/no utilizable ante el análisis a gran escala que, por su nombre, está diseñado para aplicaciones a gran escala de manos libres.
0 votos
Sí, puede hacerlo con un modelo lineal. No sé Prophet pero si esto es todo lo que está haciendo entonces no hay ninguna diferencia.