Estoy teniendo dificultades para lidiar con una serie de tiempo de las relaciones entre dos números.
Tengo dos series de tiempo, básicamente un recuento de los "éxitos" y "ensayos". Lo que me interesa, sin embargo, es la relación entre estos dos números: quiero extrapolar esta tasa de éxito para el conjunto de la población.
Otra complicación es que estoy seguro de que (como en el 99% seguro) que los períodos anteriores están fuertemente sesgadas y no representan a la población.
Ahora, no estoy seguro de cómo me podría modelo de este. Traté de modelización de la serie como un paseo aleatorio por el registro de la relación. Algo como (siguiendo este ejemplo: ):
with pm.Model() as model:
smth_parm = pm.Uniform("smth_parm", lower=0, upper=1)
tau2 = pm.Exponential("tau", 1.0/(50.0**2.0))
z2 = pm.GaussianRandomWalk("z2",
tau=tau2 / (1.0 - smth_parm),
shape=len(rates_df))
obs = pm.Normal("obs",
mu=z2*np.log(rate_df.rate_lag),
tau=tau2 / smth_parm,
observed=np.log(rates_df.rate))
Y obtuve este resultado (muestreo de la Posterior Predicción de Cheques):
Estoy BASTANTE seguro de que el período inicial debe tener una media cercana a los posteriores, incluso a costa de una mayor varianza. Pero no puedo ver cómo la fuerza que en el modelo.
Por lo tanto, necesito ayuda para:
1 - Modelo de esta relación
2- "la Fuerza" el modelo de admitir a la de períodos anteriores como sesgada
Y sé que toda esta "Serie de Ratios de Éxitos" apesta como una Beta(Binomial) debe participar, pero no estoy seguro de cómo. Y sí, el número de éxitos y de los ensayos de hacer aumentar con el tiempo, pero incluso teniendo en cuenta esto, el principio está sesgada hacia "arriba".
La mayoría de las guías y tutoriales acerca de los pronósticos, pero eso no es lo que necesito. Simplemente quiero crear un modelo que mejor describe los datos de mi. Específicamente, el futuro informar mejor a las entradas anteriores