6 votos

Generación de datos de recuentos sobredispersos con correlación serial

¿Podría alguien aportar alguna sugerencia sobre cómo generar datos de recuento sobredispersos con correlaciones seriales? Estoy utilizando el programa R para realizar un estudio de simulación. Cualquier referencia sobre este tema será muy apreciada.

Gracias por su ayuda.

7voto

John with waffle Puntos 3472

Una forma estándar de generar datos de recuento sobredispersos es generar datos a partir de una distribución de Poisson con una media aleatoria: $Y_i\sim Poisson(\lambda_i)$ , $\lambda_i \sim F$ . Por ejemplo, si $\lambda_i$ tiene una distribución Gamma, obtendrá la distribución binomial negativa para $Y$ .

Puede imponer fácilmente la correlación serial imponiendo la correlación en el $\lambda_i$ 's. Por ejemplo, podría tener $\log\lambda_i \sim AR(1)$ . Implementado en R:

N <- 100
rho <- 0.6
log.lambda <- 1 + arima.sim(model=list(ar=rho), n=N)
y <- rpois(N, lambda=exp(log.lambda))
> cor(head(y,-1), tail(y,-1))
[1] 0.4132512
> mean(y)
[1] 4.35
> var(y)
[1] 33.4015

Aquí $\lambda_i$ proceden de una distribución normal, por lo que la distribución marginal no es una distribución clásica, pero se puede ser más creativo. Tenga en cuenta también que la correlación de los $y$ no es igual a rho pero es una función de ella.

3voto

pirho Puntos 1387

Esta es una forma de hacerlo:

v = rnorm(1, 30, 10)
for (i in 2:30) v = c(v, 0.5*v[i-1] + 0.5*rnorm(1, 30, 10))
round(v)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X