17 votos

¿Se diferencia Prophet de Facebook de una regresión lineal?

Así que lo que he leído sobre El profeta de Facebook es que básicamente descompone la serie temporal en tendencia y estacionalidad. Por ejemplo, un modelo aditivo se escribiría como:

$$ y(t) = g(t) + s(t) + h(t) + e_t $$

con

  • $t$ el tiempo
  • $g(t)$ la tendencia (puede ser lineal o logística)
  • $s(t)$ la estacionalidad (diaria, semanal, anual...)
  • $h(t)$ las vacaciones
  • $e_t$ el error

Mis preguntas son: ¿No se podría hacer con una simple regresión lineal? ¿Cuáles serían las diferencias en términos de resultados si los comparamos, y por qué?

0 votos

Sí, puede hacerlo con un modelo lineal. No sé Prophet pero si esto es todo lo que está haciendo entonces no hay ninguna diferencia.

17voto

Owen Fraser-Green Puntos 642

La cuestión aquí es llegar a una ecuación que analice los datos observados en función de la señal y el ruido. Si los datos son sencillos, el enfoque de regresión puede funcionar. Hay que tener cuidado para entender algunos de los supuestos que están haciendo con Prophet. Debería entender mejor lo que hace Prophet, ya que no se limita a ajustar un modelo simple, sino que intenta añadir algo de estructura.

Por ejemplo, algunas reflexiones que hice después de leer su bien redactada introducción podrían ayudarte en tu evaluación. Pido disculpas de antemano si he entendido mal su planteamiento, y me gustaría que me corrigieran si es así.

1) Su ejemplo principal tiene dos puntos de ruptura en la tendencia, pero sólo capturaron el más obvio.

2) Ignoran cualquier estructura ARIMA que refleje series estocásticas omitidas o el valor de utilizar valores históricos de Y para guiar la previsión.

3) Ignoran cualquier posible dinámica (efectos de adelanto y retraso) de las series estocásticas y deterministas sugeridas por el usuario. Los efectos de regresión causal de Prophet son simplemente contemporáneos.

4) No se intenta identificar los cambios de escalón/nivel en las series o los pulsos estacionales, por ejemplo, un cambio en el EFECTO LUNES a mitad de tiempo debido a algún acontecimiento externo desconocido. Prophet asume un "crecimiento lineal simple" en lugar de validarlo examinando posibilidades alternativas. Para un posible ejemplo de ello, véase Previsión de pedidos recurrentes para un negocio de suscripción en línea utilizando Facebook Prophet y R

5) Los senos y cosenos son una forma opaca de tratar la estacionalidad, mientras que los efectos estacionales como el día de la semana, el día del mes, la semana del mes, el mes del año son mucho más efectivos/informativos cuando se trata de efectos antropogénicos (¡tratando con humanos!).

Sugerir frecuencias de 365,25 para patrones anuales no tiene mucho sentido porque no realizamos la misma acción exactamente el mismo día que el año pasado, mientras que la actividad mensual es mucho más persistente, pero Prophet no parece ofrecer la opción de 11 indicadores mensuales. Las frecuencias semanales de 52 tienen poco sentido porque no tenemos 52 semanas en todos los años.

6) No se intenta validar que los procesos de error sean gaussianos para poder realizar pruebas de significación significativas.

7) No hay preocupación por que la varianza del error del modelo sea homogénea, es decir, que no cambie de forma determinista en puntos concretos del tiempo que sugieren los mínimos cuadrados ponderados. No hay preocupación por encontrar una transformada de potencia óptima para que la varianza del error sea proporcional al Valor Esperado ¿Cuándo (y por qué) hay que tomar el logaritmo de una distribución (de números)? .

8) El usuario tiene que especificar previamente todos los posibles efectos de adelanto y retraso en torno a los eventos/festividades. Por ejemplo, las ventas diarias suelen empezar a aumentar a finales de noviembre, lo que refleja un efecto a largo plazo de la Navidad.

9) No se preocupan de que los errores resultantes estén libres de estructura sugiriendo formas de mejorar el modelo mediante la comprobación del diagnóstico de suficiencia.

10) Aparentemente no hay preocupación por mejorar el modelo eliminando la estructura no significativa.

11) No es posible obtener una familia de previsiones simuladas en las que los límites de confianza no sean necesariamente simétricos, mediante el bootstrapping de los errores del modelo con la previsión de posibles anomalías.

12) Dejar que el usuario haga suposiciones sobre las tendencias (el número de puntos de ruptura de la tendencia y los puntos de ruptura reales) permite una flexibilidad no deseada/no utilizable ante el análisis a gran escala que, por su nombre, está diseñado para aplicaciones a gran escala de manos libres.

1 votos

Estoy de acuerdo, pero yo diría que esas cosas están más cerca de ser características "agradables de tener" que "imprescindibles". Se pueden tener modelos de previsión de alta calidad sin algunas de ellas. Pero, como ya he dicho, buenos puntos y una buena reseña.

0 votos

Tiene usted razón en su reflexión...la complejidad inherente a los "datos" es la cuestión dominante. Los datos simples... necesitan soluciones simples... los datos complejos sugieren que lo "agradable de tener" podría convertirse en "necesario de tener". Sólo los datos lo saben con certeza. Me viene a la mente la navaja de Occam...

0 votos

@Tim stats.stackexchange.com/questions/417908/ sugiere que algunas características que son "agradables de tener" deberían ser en realidad "obligatorias" para frustrar supuestos inadecuados como la "simple tendencia lineal".

11voto

mkt Puntos 688

No lo he utilizado, pero esto es su preimpresión (énfasis mío):

La previsión es una tarea común de la ciencia de datos que ayuda a las organizaciones con la planificación de la capacidad, el establecimiento de objetivos y la detección de anomalías. A pesar de que su importancia, hay serios desafíos asociados a la producción de de calidad, especialmente cuando hay una gran variedad de series temporales y de series temporales y los analistas con experiencia en la modelización de de series temporales son relativamente escasos . Para hacer frente a estos retos, describimos un enfoque práctico para la previsión "a escala" que combina modelos configurables con el análisis de rendimiento del analista en el bucle . Nosotros proponemos un modelo de regresión modular con parámetros interpretables que que pueden ser ajustados intuitivamente por los analistas con conocimiento de las las series temporales. Describimos los análisis de rendimiento para comparar y comparar y evaluar los procedimientos de previsión, y marcamos automáticamente las previsiones para para su revisión y ajuste manual. Herramientas que ayudan a los analistas a utilizar su experiencia de forma más eficaz permiten realizar previsiones fiables y prácticas de de las series temporales de las empresas.

En la introducción:

Hemos observado dos temas principales en la práctica de la creación de empresas de las previsiones empresariales. En primer lugar, las técnicas de previsión completamente automáticas pueden ser de previsión completamente automáticas pueden ser difíciles de afinar y a menudo son demasiado inflexibles para incorporar suposiciones o heurísticas útiles. En segundo lugar, los analistas responsables de las tareas de datos en una organización suelen tener una gran experiencia en experiencia sobre los productos o servicios específicos que apoyan, pero a menudo no tienen formación en previsión de series temporales.

Por lo tanto, me parece que no están reclamando haber hecho un sustancial estadística avance aquí (aunque es capaz de mucho más que el simple modelo que esbozas). En cambio, afirman que su sistema hace posible que un gran número de personas sin experiencia en el análisis de series temporales generen previsiones mientras aplican su propia experiencia en el dominio y las restricciones específicas del sistema.

Si ya tiene experiencia en el análisis de series temporales y en la codificación de modelos complejos, puede que esto no le resulte muy útil. Pero si sus afirmaciones son ciertas, ¡podría ser enormemente útil! La ciencia (y el comercio) avanza no sólo por las nuevas ideas, sino también por las nuevas herramientas y su difusión (véase este pieza corta de Freeman Dyson sobre el tema y esta respuesta ).

Por poner un ejemplo de la propia estadística: R no representó un avance estadístico, pero ha tenido una gran influencia porque facilitó a mucha más gente la realización de análisis estadísticos. Ha sido el andamiaje sobre el que se ha construido una gran cantidad de conocimientos estadísticos. Si tenemos suerte, Prophet puede desempeñar un papel similar.

Dyson, Freeman J. "¿La ciencia se rige principalmente por las ideas o por las herramientas?". Science 338, nº 6113 (2012): 1426-1427.

2voto

JanithaR Puntos 141

Te faltan los puntos de cambio, splines lineales a trozos, que se pueden implementar en modelos lineales.

Tienes razón en que al menos en el caso límite es una regresión lineal regularizada (regularización L1 y L2).

Hay que tener en cuenta que existe un modelo de profeta distinto, el crecimiento logístico.

Además, supones que los factores estacionales son aditivos, pero también admiten efectos estacionales multiplicativos, lo que parece más natural al menos para la modelización del crecimiento.

0 votos

El supuesto profeta de la toma de troncos se enfrenta a esta valiosa discusión ... stats.stackexchange.com/questions/18844/ donde las transformaciones de potencia se justifican en base a una relación empírica entre el Valor Esperado y la varianza del error del modelo O una presunción específica no lineal basada en el conocimiento del dominio.

0 votos

@IrishStat Gracias por ese punto (había olvidado que transforman los logaritmos para implementar la estacionalidad multiplicativa, usan STAN, así que creo que podrían haber usado un modelo no lineal en lugar de tomar logaritmos). ¿Puedes explicar tu distinción entre la presunción de estacionalidad multiplicativa y la "presunción no lineal"?

0 votos

Si miras la respuesta de @whuber stats.stackexchange.com/questions/298/ Sugiere que se realicen transformaciones "cuando la teoría científica lo indique", lo que supondría una posible suposición no lineal basada en el conocimiento del dominio. Las transformaciones de potencia empíricas son útiles cuando la varianza de los errores resulta ser proporcional al valor esperado, de lo contrario podría ser simplemente "un escaparate".

1voto

Aksakal Puntos 11351

Se puede hacer mucho con una simple regresión lineal, pero no todo lo que hace Prophet. Sólo un ejemplo, usted puede especificar su propio candidato de punto de cambio para una tendencia, y Prophet lo utilizará como un previo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X