Nada será capaz de demostrar de una manera o de otra, porque incluso si usted encuentra que los ingresos se ha reducido a partir de ese momento, usted no será capaz de descartar la posibilidad de otros cambios estructurales (por ejemplo, nuevo competidor, el nuevo entorno regulatorio, se ha cambiado la moda, algo que no se puede siquiera pensar...).
Usted puede utilizar el tiempo de la serie de técnicas para identificar si la sincronización de los cambios en el sistema se asocia con una disminución en los ingresos; o, mejor para sus objetivos, usted podría ser capaz de despedir a que la demanda (y si no hay una disminución evidente, no hay nada que explicar, ¿verdad? bueno, tal vez... el problema es la construcción de un contrafactual.).
Los problemas que tendrá que lidiar con la voluntad de incluir; la estacionalidad (micro por ejemplo semanal y macro por ejemplo verano v de invierno); el crecimiento de la o las tendencias de otros; y la correlación serial de sus observaciones.
En el gráfico a continuación a partir de los datos simulados se puede ver una manera de ir sobre esto.
Usted puede ajustar a un modelo de algún tipo, basado en que no hay ningún cambio en el tiempo - en este caso, he ajuste de un modelo lineal con la variable de respuesta en una escala logarítmica, lo cual es equivalente a decir que el diario de ingresos está creciendo a un ritmo constante. Esta hipótesis nula se muestra con la línea negra.
Las líneas roja y azul, por otro lado, mostrar una alternativa, de modelos más complejos, lo que permite a la vez un cambio en el nivel de ingresos y un cambio en la tasa de crecimiento (en este caso negativo) como resultado de la introducción del nuevo sistema. Una vez que haya este ajuste de modelos más complejos así, a continuación, puede probar para evidencia estadísticamente significativa de que este modelo se necesita más que la simple línea negra modelo.
(Tenga en cuenta que en este caso, si usted hizo una simple prueba t de comparación de antes y después de situaciones como @pgericson sugiere, sería la conclusión de que había significativamente el aumento de los ingresos con el nuevo sistema, porque subyacente de la tasa de crecimiento en los meses previos al nuevo sistema.)
Ahora, el peligro a tener en cuenta, es que no se puede encajar en un modelo en la forma que se haría con la sección transversal de los datos. Usted necesidad de permitir que el hecho de que los ingresos de la observación de un día no agrega mucho a la de los ingresos de la observación el día antes, que probablemente están altamente correlacionados y no completamente nueva información. Cualquier estadísticas o econométricas paquete que se precie va a permitir esto; en R, usted puede utilizar cualquiera de los gls() en el nlme biblioteca o arima() para hacerlo.
Mi código R que simulaba los datos e hizo algunos análisis básicos en que se pega a continuación.
#simulate data
set.seed(80)
x <- ts(100*exp(1:1000*0.001), frequency=7)
e <- rnorm(1002,0,10)
x <- x+ 0.5*e[1:1000] + 0.8*e[2:1001] + e[3:1002]
changed <- rep(c(0,1), c(800,200))
x <- x + cumsum(changed)^0.4 * rnorm(1000, -8,1)
# check it looks ok
par(mfrow=c(2,1))
plot(x, main="Daily revenue ($'000)", xlab="weeks", ylab="(original)")
abline(v=801/7, col="grey50")
plot(x, ylab="(logarithmic)", xlab="weeks", log="y")
abline(v=801/7, col="grey50")
# t test makes it look like you've increased revenue! -
# because it ignores the trend
t.test(x~changed)
# Much better is to illustrate in some kind of model
# that can take into account any growth trend.
# With real data this will be quite complex, but
# in my simulated data the growth is nice and regular
# so it is easy to see if it is disrupted.
x.df <- data.frame(x=x, changed=changed, day=1:1000)
win.graph()
x.lm1 <- lm(log(x)~day, data=x.df)
plot(x, ylab="(logarithmic)", xlab="weeks", log="y", bty="l")
abline(v=801/7, col="grey50")
lines(1:1000/7, exp(predict(x.lm1)), lwd=3)
x.lm2 <- lm(log(x)~day*changed, data=x.df)
lines(1:800/7, exp(predict(x.lm2))[1:800], col="red", lwd=3)
lines(801:1000/7, exp(predict(x.lm2))[801:1000], col="blue", lwd=3)
anova(x.lm2) # shows "changed" is significant
summary(x.lm2) # could be used to estimate how much change has happened
# The problem with this approach though is that
# the errors are serially correlated and hence the inferences
# based on them being iid will not be justifiable. As shown by this diagnostic
# plot:
acf(residuals(x.lm2))
library(nlme)
x.lm3 <- gls(log(x)~day*changed, data=x.df, correlation=corAR1())
anova(x.lm3) # "changed" is still significant but much higher p values
summary(x.lm3)
# I'd like to fit a model with more lags in the autoregression structure
# but the following code takes frigging ages for some reason (eventually came out OK)
x.lm4 <- update(x.lm3, correlation=corARMA(c(0.6, 0.2), p=2, q=0),
control=glsControl(msVerbose=TRUE))