Tengo muy pocos conocimientos de análisis de series temporales (a pesar de mi máster en estadística, no hice más que un curso introductorio), pero ahora me enfrento a un problema estadístico cuya respuesta es precisamente este tipo de análisis, así que necesitaría que me echaran una mano.
En pocas palabras, tengo en cuenta las ventas mensuales. En sólo algunos de ellas (de 1 a 10 más o menos), se ha llevado a cabo un proyecto de marketing (las llamo cuentas Afectadas); las demás cuentas permanecen inalteradas (las llamo cuentas de Control). La pregunta a la que tengo que responder es básicamente "¿tuvo el proyecto un impacto en las ventas Afectadas (pero aquí está la parte que me molesta) en comparación con las ventas de Control?". Entonces, como tengo un análisis de series temporales (y una estacionalidad) supuse que tenía que realizar un proc ARIMA (estoy usando SAS - y su fantástica función que me descubre y muestra un modelo ajustado automáticamente, Time Series Forecasting System). Aquí están mis preguntas:
-
¿Cómo se tiene en cuenta una variable de ajuste en un modelo ARIMA? Si hago una conjetura a partir del modelo de regresión lineal, supongo que sólo tengo que introducir la variable en la ENTRADA, como variables independientes/explicativas. Además, si introduzco mi variable "Control_ventas" de esta forma, ¿es correcto mi ajuste? ¿No debería hacer una transformación preliminar de mi variable dependiente, por ejemplo redefiniéndola como (Ventas_afectadas/Ventas_de_control) o (Ventas_afectadas - Ventas_de_control)?
-
Además, tengo otra serie de preguntas en torno al análisis de la Intervención - porque la realización de los proyectos nunca es una intervención directa, de pulso, y no puedo adscribirlos realmente a un tipo preciso. Esta es la mejor explicación que puedo dar: Los proyectos, como ya he dicho, no se llevan a cabo en todas las cuentas, sino sólo en una parte muy pequeña de ellas. Además, los proyectos pueden considerarse campañas de marketing que duran varios meses. Tienen una fecha de inicio y una fecha de ejecución (=final). Pero incluso entre mis supervisores hay desacuerdo sobre cuándo deberíamos empezar a evaluar un efecto en las ventas: a veces, las ventas empiezan a aumentar durante la campaña, la mayoría de las veces, el efecto se ve después del final del proyecto, pero no inmediatamente después, quizás de 2 a 9 meses después... Así que estoy muy confuso a la hora de modelizar el tipo de intervención (¿una rampa? ¿varios pulsos?) y me pregunto si no sería mejor que realizara una Detección de la Intervención, para ver dónde se produjo realmente el impacto, y en la parte de discusión de mi análisis compararlo con la fecha de implementación "teórica" comunicada. Creo profundamente que esta idea sería la más atractiva, debido al hecho de que nadie es capaz de tener claro el punto de inicio de la Intervención (estadísticamente hablando). ¿Qué opina usted? ¿Cómo lo haría usted? Pero ahí viene la parte más difícil: No tengo ninguna pista de cómo realizar una Detección de Intervención...
Me vendría muy bien un consejo.
PS. También quería decir que estoy encantado de facilitar los datos si pueden ayudar en el debate.
Actualización
Aquí están mis datos, si eso puede ayudar. Lo ideal sería que se adhieren a la ARIMA (u otro modelo de series temporales, mejor ajuste) porque no me siento cómodo en absoluto con este campo y esto es algo que actualmente soy capaz de hacer (no sé nada acerca de VAR o causalidad de Granger).
Además, sólo he recogido las ventas de Jun-13 en adelante, ya que me había fijado un límite de 6 meses para la "venta sbefore", pero puedo tener cifras hasta 2011.... No sé sin embargo hasta qué punto es relevante incluirlas en el análisis - y si eso no podría "diluir" el impacto de la intervención ?
Actualización 2
Datos a partir de 2011
Date Sales_nat Sales_affected
Jan-11 13535.04614 10564.2
Feb-11 12255.18701 6338.52
Mar-11 15504.88513 16902.72
Apr-11 13259.76914 14085.6
May-11 15967.85091 13381.32
Jun-11 15351.15898 9859.92
Jul-11 16001.81365 16902.72
Aug-11 20151.51071 23692.09
Sep-11 21533.29437 30507.47
Oct-11 21122.32893 19242.99
Nov-11 22350.66487 25579.51
Dec-11 21707.95193 15019.31
Jan-12 23225.30391 28394.63
Feb-12 22782.53005 23466.67
Mar-12 24346.6397 30030.61
Apr-12 23093.62005 21361.83
May-12 26336.53924 22530.96
Jun-12 22695.90797 18770.13
Jul-12 26825.00843 21824.68
Aug-12 26202.68137 23225.24
Sep-12 24917.01741 23929.52
Oct-12 30170.13777 20649.55
Nov-12 28223.8397 27215.49
Dec-12 28165.34954 19713.84
Jan-13 30716.72604 20182.69
Feb-13 26684.0364 28867.48
Mar-13 28277.98102 15019.31
Apr-13 30858.22655 28159.2
May-13 31845.99066 24871.22
Jun-13 29444.00066 31425.17
Jul-13 34896.64914 41989.37
Aug-13 30925.31929 23945.52
Sep-13 32861.02081 25577.51
Oct-13 34976.22452 10795.63
Nov-13 32547.14685 31668.6
Dec-13 38381.84523 35435.43
Jan-14 40211.59741 4221.68
Feb-14 31925.53772 29569.76
Mar-14 37865.2967 49251.59
Apr-14 39391.11061 28865.48
May-14 35614.36797 7042.8
Jun-14 41398.94482 37316.84