6 votos

encontrar el punto en que la curva significativamente se dispara

así que esto es un poco complejo para mí y espero que alguien me puede ayudar. No tengo una formación matemática. Tengo una serie de tiempo de las precipitaciones durante 50 años para una situación particular. Ese lugar está marcado por una muy definida temporada de lluvias (normalmente a partir de alrededor de la primera semana de junio de cada año). Por lo tanto, sería de esperar un aumento repentino de alrededor de precipitaciones de junio, que dura aprox 2-3 meses y luego se desploma hacia abajo.

Yo estaba interesado en saber qué tipo de estadística o matemática técnicas se pueden utilizar para marcar las fechas para cada año, cuando el monzón comienza. Básicamente quiero calcular el rough de la aparición de las fechas de cada año.

Lo siento si esta pregunta es un poco vago.

Gracias

1voto

Calin Uioreanu Puntos 11

Usted podría utilizar la Detección de valores Atípicos de la Serie de Tiempo (Zhao - R y minería de datos). Time Series Decomposition - Outlier Detection

El primer gráfico es la original de la serie de tiempo, la segunda la estacionalidad , la tercera muestra la tendencia y la última parcelas de los valores atípicos en la parte superior de los componentes restantes después de la eliminación de la tendencia y la estacionalidad. Reproducible código de ejemplo:

# use robust fitting
f <- stl(AirPassengers, "periodic", robust=TRUE)
(outliers <- which(f$weights<1e-8))

# set layout
op <- par(mar=c(0, 4, 0, 3), oma=c(5, 0, 4, 0), mfcol=c(4, 1))
plot(f, set.pars=NULL)
sts <- f$time.series

# plot outliers
points(time(sts)[outliers], sts[,"remainder"][outliers], pch="x", col="red", cex=2)
par(op) # reset layout

0voto

Heath Puntos 1042

Esto realmente depende de lo que los datos parecen.

Sin una parcela y a partir de la descripción suena como la media se incrementa durante la temporada de lluvias. Si es sólo un caso de un valor de referencia de la lluvia fuera de la temporada de lluvias y, a continuación, cambia a otro (superior) de línea de base durante la temporada de lluvias, a continuación, usted está buscando en un cambio en el modelo de promedio. Usted puede ajustar este uso de la cpt.mean función en el paquete de R changepoint.

Alternativamente, si en realidad no hay dos líneas de base y durante la temporada de lluvias se puede ver un aumento en la media, pero que en realidad no es constante y la variabilidad es mayor, entonces usted puede ser que desee para transformar los datos. La manera más fácil de hacer esto es tomar primeras diferencias, es decir, $x_2-x_1$ (usted puede utilizar el diff función en R). A continuación encontrará la changepoint en las diferencias que se haría uso de la cpt.var función en el changepoint paquete.

Ambos de estos detectar cambios en la media y la varianza, respectivamente. Sin ver los datos es difícil saber que uno (si cualquiera) puede ser adecuado para los datos.

0voto

Aksakal Puntos 11351

Me gustaría empezar con la aplicación de los kernel más suave, como la de Gauss. Le dará una curva suave $f(t)$, donde se puede jugar con la escala de la longitud de la $b$ para obtener la curva suave como usted desea. Ahora, usted puede aplicar los métodos de análisis, tales como la primera derivada $\frac{df(t)}{dt}>a$ donde $a$ es de un cierto umbral, para identificar el punto de inicio de la precipitación durante el año. Empezar con la representación gráfica de la $f(t)$, para obtener más de la intuición sobre el alisado de la curva.

0voto

John Richardson Puntos 1197

Si usted sólo está buscando en el modelado de la estacionalidad en los datos, se puede utilizar un (posiblemente no lineal) modelo de regresión para predecir la lluvia como una función del seno y coseno de los días del año. Si desea buscar cambios o tendencias, entonces usted podría incluir otras variables, tales como el número de días desde el inicio del conjunto de datos.

Sin embargo, los datos de la lluvia (a menos que en promedio sobre un área muy grande) tendrá un montón de ceros, que representan los días en que no llueve, y es probable que esto sesgar el análisis a menos que esto sea tomado en cuenta. El método que más me gusta es la mezcla de Bernoulli-Gamma modelo ideado por Peter Williams, que de manera conjunta modelos de la ocurrencia y el monto de los procesos con una sola posibilidad. Realmente es muy elegante y he encontrado que es muy útil para mi trabajo en la conversión de los datos de precipitación. Sospecho que el papel iba a ser de interés para cualquiera de realizar análisis estadísticos de los datos de la lluvia (al menos a nivel de la estación). Nota este artículo discute la modelización de la estacionalidad y tendencias.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X