Hay 3 principales funciones en el paquete de changepoint, cpt.mean
, cpt.var
y cpt.meanvar
. Como profesional, estas son las únicas funciones en el paquete que usted necesita. Si usted piensa que sus datos pueden incluir un cambio en la media, a continuación, utilizar la cpt.mean
función, etc.
La siguiente pregunta que usted debe preguntarse si si usted está buscando para una sola o múltiples cambios dentro de sus datos. El method
argumento se encarga de esto, hay AMOC para Más de Un Cambio, y PELT, BinSeg y SegNeigh varios cambios. Que varios de changepoint método que desea utilizar depende de:
a) la elección de la distribución / distribución de método libre de (ver más abajo) y
b) ¿de cuánto tiempo usted ha / cómo es exacto que desea que su respuesta sea.
El BinSeg es rápido pero aproximada, PELT es exacto y rápido, pero no puede ser utilizado en todas las distribuciones, SegNeigh es exacta, pero lento.
La siguiente pregunta es qué supuestos se puede / está dispuesto a hacer acerca de sus datos. La clave aquí es que la presunción se aplica a cada conjunto de datos, entre los cambios y no para la totalidad de los datos. Por ejemplo, usted puede ser capaz de asumir una distribución Normal, pero si de hacer una prueba de Normalidad en el conjunto de los datos, es más probable que falle (debido a posibles cambios). Por lo tanto normalmente hacemos una suposición, ejecute el análisis de changepoint, a continuación, comprobar las suposiciones basadas en los cambios identificados.
De nuevo, dependiendo del tipo de cambio son diferentes, la distribución y la distribución libre de los métodos. Consulte la documentación de cada una de las funciones para las elecciones y siéntase libre de comentar lo que prueba estadística de que usted está pensando en usar y me puede hacer una lista de los supuestos.
Por último, nos fijamos en la pena. La pena, establece un compromiso entre un montón de pequeños cambios y no cambios. Por lo tanto, si se establece la pena de 0 a continuación, obtener un cambio en todos los lugares posibles y si se establece la pena hasta el infinito, entonces usted consigue sin cambios. El valor apropiado de la pena depende de tus datos y la pregunta que se quiere responder.
Por ejemplo, usted podría haber cambios en la media de 0.5 unidades, pero sólo se puede estar interesado en los cambios de 1+ unidades.
Hay muchas maneras de elegir tu pena:
"por los ojos", es decir, pruebe con diferentes valores hasta que encuentres uno que parece adecuada para su problema.
"el codo de la trama", es decir, de la parcela el número de changepoints identificado en contra de la pena de usa. Esto crea una curva, por lo que pequeños valores de la pena produce grandes (espurio) los cambios y como el castigo disminuye estos falsos cambios de dejar a un ritmo rápido, esta tasa disminuye a medida que sólo los verdaderos cambios están a la izquierda antes de lentamente cayendo a que no hay cambios de sanciones más severas. La idea es poner 2 líneas rectas para esta curva y seleccione la pena donde se cruzan. Esto produce un ad-hoc, pero más objetivos de la manera de elegir a la pena de 1.
el uso de un criterio de información. Hay algunos como el AIC, BIC/SIC, Hannan-Quinn incluido en el paquete. Hay otros que no están incluidos en el paquete, pero puede proporcionar una fórmula para pen.value
, si lo desea.
Si usted necesita más información o aclaraciones sobre puntos específicos, solo un comentario y trataré de contestarla.