5 votos

Número de eventos de tipo B da números eventos de tipo A en un proceso de Poisson

Tengo una simple probabilidad cálculo estaba trabajando en eso se me ocurrió una respuesta, sino una pregunta, me preguntó un colega me llevó a idear un segundo enfoque - y una respuesta diferente. Me puso de lado en el tiempo (un par de años atrás), pero ahora es persistente en mí.

Creo que mi respuesta original es correcta, porque de otras consideraciones, pero no he logrado identificar una falla en cualquiera de los dos enfoques; te agradecería respuestas que arrojan luz sobre por qué uno de ellos debe estar equivocado.

Imaginemos a dos (independiente) procesos de Poisson ('tipo' y 'tipo B' decir) sucediendo a lo largo de un intervalo, escriba Un que sucede en la tasa de $k_1 . \lambda$ y de tipo B a la tasa de $k_2 .\lambda$ donde $k$'s son conocidos (esto podría ser también considerado como un particiones proceso de Poisson). Sin embargo, sólo se puede ver el tipo de eventos (observamos $n > 0$ eventos de tipo a). La idea es tratar de obtener la distribución del tipo B eventos dada la observó tipo A. Poner la B eventos en minúsculas (a destacar que no hemos visto):

  | b  A  b b A   A   b   AA  b bb  A b |
  0                                     1

Sobre el tipo como Un 'éxito' y B 'fracaso' - reconociendo que el desconocimiento de los tiempos reales (que en realidad no observar) - y sólo teniendo en cuenta el orden de los eventos, es claro de inmediato que el número de b hasta a la $n^{th}$ es NegBin$(n,p)$ donde $p = k_2/(k_1 + k_2)$ (siendo este el 'recuento de los fallos de la versión de la Binomial Negativa, en lugar de 'el recuento de los ensayos en función de la versión).

El problema viene con cómo lidiar con el número de eventos entre el pasado y el final del intervalo.

Una manera de verlo es considerar ahora mirando desde el extremo de la derecha hacia la izquierda. El número de errores en el primer éxito de la derecha es NegBin$(1,p)$, con lo que el número total de eventos de tipo B condicionada a a $n$ eventos de tipo a en el intervalo completo NegBin$(n+1,p)$.

La otra manera de verlo es considerar el conjunto de intervalo como en un círculo. Ahora, entre cada consecutivos par de a's, el número de B es NegBin$(1,p)$ e con $n$ intervalos que el número total de B es NegBin$(n,p)$.

(El primer argumento es el que el compañero pregunta me llevó a hacer)

Por el memoryless de la propiedad, no importa donde el intervalo comienza; cada vez, el número de eventos para el siguiente debe de ser NB$(1,p)$

Sin embargo, las respuestas no pueden ser ambas correctas. Que tiene de malo?

5voto

John with waffle Puntos 3472

Me atrevería a decir que ambas respuestas son incorrectas? Desde $A$ $B$ provienen de procesos independientes, el número de eventos de tipo $A$ $[0,1]$ intervalo no tiene ningún efecto sobre el número de eventos de tipo $B$ en el mismo intervalo de tiempo. Por lo que la distribución de $B$s todavía se $Pois(k_2\lambda)$.

Este es un estudio de simulación para demostrar que:

R <- 10000
lbda <- 10
k1 <- 1
k2 <- 1.2
a <- rpois(R, lambda=lbda *k1)  # number of type A events
b <- rpois(R, lambda=lbda *k2)  # number of type B events
n <- 5
# select the samples where there are 'n' type A events
b.short <- b[a==n]
# plot results
plot(ecdf(b.short), main="Conditional distribution of B", xlim=c(0,max(b.short)))
 curve(ppois(x, lambda=k2*lbda), col=2, add=TRUE)
 curve(pnbinom(x, size=n, prob=k2/(k1+k2)), col=3, add=TRUE)
 curve(pnbinom(x, size=n+1, prob=k2/(k1+k2)), col=4, add=TRUE)
 legend(0, 1, c("Simulated","Poisson", "NB(n,p)", "NB(n+1,p)"),
        col=1:4, lty=1, pch=c(19,NA,NA,NA), xjust=0, yjust=1)

Simulation results

Por supuesto, esto no es muy útil, porque no sabemos $\lambda$. Podemos, sin embargo, se estima a partir del número de observados $A$s. A partir de aquí, tendría que ser específica acerca de la estimación y, a continuación, uno podría ser capaz de hablar acerca de las propiedades de $\hat{B}$.

EDIT: intervalo de predicción

Parece que usted está interesado en la distribución de $B$ sólo para los fines de un intervalo de predicción. Creo que usted puede utilizar su argumento para construir uno. Deje $B_n$ el número de $B$ eventos antes de la $n$th $A$ evento. A continuación,$B_n \sim NB(n,p)$$B_A | A=n \sim NB(A,p)$, y para cualquier muestra dada $B_n \leq B \leq B_{n+1}$. Así que no es descabellado usar los intervalos de predicción para cualquiera de ellos. En una primera mirada, la primera debe encubierta, mientras que el segundo sobrecubierta, pero en la práctica discretos intervalos de confianza a menudo sobrecubierta, por lo que incluso la primera de ellas podría ser ACEPTAR.

Sólo a seguir en la anterior simulación:

coverage <- function(values, ints){
    mean( (ints[,1] <= values) & (values <= ints[,2]))
}
pred1 <- cbind(qnbinom(0.025, size=a, prob=k1/(k1+k2)), 
               qnbinom(0.975, size=a, prob=k1/(k1+k2)))
pred2 <- cbind(qnbinom(0.025, size=a+1, prob=k1/(k1+k2)), 
               qnbinom(0.975, size=a+1, prob=k1/(k1+k2)))   
# correct prediction interval
pred3 <- cbind(qpois(0.025, lambda=k2*lbda), 
               qpois(0.975, lambda=k2*lbda))

coverage(b, pred1)
[1] 0.9565
coverage(b, pred2)
[1] 0.9632
coverage(b, pred3)   
[1] 0.9593

Por lo pred1 undercovers con respecto a la "correcta" intervalos (que sobrecubierta), y pred2 overcovers en comparación con él. También tenga en cuenta que una de las ventajas de la $NB(n+1,p)$ intervalo es la que se ha definido aún para $n=0$.

Sólo para resumir, ninguno de los argumentos son correctos, $B|A$ todavía tiene una distribución de Poisson, pero ambos de sus distribuciones podría ser utilizado para una predicción razonable intervalo de $B$.

1voto

Ηλίας Puntos 109

Lo siento por haber tomado tanto tiempo para leer correctamente el enunciado del problema. La distribución de Poisson procesos acaba de ocultar el problema. Básicamente, usted tiene dos independientes de Poisson varia $X_1 \sim {\cal P}(\lambda k_1)$ $X_2 \sim {\cal P}(\lambda k_2)$ conoce $k_1, k_2$ y desconocido $\lambda$, y se basa en una comprensión de $x_1$ $X_1$ el objetivo es predecir la realización $x_2$$X_2$.

Un enfoque Bayesiano con el Jeffreys/Bernardo previo proporciona una predicción intervalo de disfrutar de muy buena frecuentista propiedades. Asumir la Jeffreys antes de $\Gamma(\frac12,0)$$\lambda$. Luego, después de observar a $x_1$ la posterior distribución en $\lambda$$\Gamma(x_1+\frac12, k_1)$. La integración de la distribución de $X_2$ con respecto al $\lambda$ posterior distribución de los rendimientos de la ${\cal P}{\cal G}(x_1+\frac12, k_1/k_2)$ (Poisson-Gamma) de la distribución como la posterior distribución predictiva de $x_2$, que es igual al negativo de la distribución binomial ${\cal N}{\cal B}(x_1+\frac12, k_1/(k_1+k_2))$. Tomando cuantiles de esta distribución proporciona un intervalo de predicción acerca de $x_2$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X