El intervalo de confianza exacto de dos caras del 95% es correcto $[\lambda^{-},\lambda^{+}]$ se calcula a partir de una observación $x$ de una variable de Poisson $X$ utilizando las relaciones definitorias
$$\Pr(X\lt x;\lambda^{-}) = \alpha/2$$
y
$$\Pr(X \gt x; \lambda^{+}) = 1 - \alpha/2.$$
Podemos encontrar estos límites explotando
$$e^{-\lambda}\sum_{i=0}^{x}\frac{\lambda^i}{i!} = F_{\text{Poisson}}(x;\lambda) = 1 - F_\Gamma(\lambda;x+1) = \frac{1}{x!}\int_\lambda^\infty t^x e^{-t}\,\mathrm{d}t$$
para números naturales $x.$
(Se puede demostrar inductivamente vía integraciones repetidas por partes en el lado derecho o se puede observar que la probabilidad izquierda es la probabilidad de observar $x$ o menos puntos en un proceso de Poisson homogéneo de tasa unitaria que transcurre durante un tiempo $\lambda;$ mientras que la probabilidad correcta es la posibilidad de que su tome más de $\lambda$ tiempo para observar el $x+1^\text{st}$ punto -- que obviamente es el mismo evento).
Así pues, escribir $G=F_\Gamma^{-1}$ para la función cuantil Gamma, el intervalo de confianza es
$$\left[G(\alpha/2;x), G(1-\alpha/2;x+1)\right].$$
La discreción en las desigualdades definitorias, es decir, la distinción entre " $\lt$ " y " $\le$ " -- es el culpable de la aparente incoherencia con el valor p. De hecho, en la mayoría de las circunstancias sustituir el límite inferior por $G(\alpha/2,x+1)$ en realidad da mejor cobertura, como muestran las simulaciones. Aquí, por ejemplo, hay simulaciones en R
que estiman las coberturas de estos dos procedimientos.
f <- function(x, alpha=0.05) qgamma(c(alpha/2, 1-alpha/2), c(x, x+1))
z <- 10
x <- matrix(rpois(2e6, f(z)), 2)
mean(x[1,] <= z & z <= x[2,])
La salida, que es idéntica a la de poisson.test
, se acercará al 97,7% de cobertura. El intervalo alterado es
f. <- function(x, alpha=0.05) qgamma(c(alpha/2, 1-alpha/2), x+1)
x <- matrix(rpois(2e6, f.(z)), 2)
mean(x[1,] <= z & z <= x[2,])
El resultado se aproximará al 96,3% de cobertura, más cerca del nivel nominal del 95%.
El problema es que ad hoc modificación es que falla cuando la tasa real es ínfima. En la misma simulación con una tasa real de $1/10$ en lugar de $10,$ la cobertura del intervalo correcto ronda el 98%, pero la del intervalo modificado es sólo del 94,4%. Si su objetivo es lograr una cobertura del 95% o superior -sin bajar más-, esto es inaceptable. Para muchas aplicaciones, especialmente cuando valores muy pequeños del parámetro son muy poco probables, el intervalo modificado tiene mucho que recomendar y producirá resultados más coherentes con el valor p.
Referencia
Hahn, GJ y WQ Meeker, Intervalos estadísticos . Wiley 1991.
Su fórmula (7.1), expresada en términos de cuantiles de distribuciones chi-cuadrado, es equivalente a la que yo doy en términos de distribuciones Gamma. (Distribuciones chi-cuadrado con $2x$ grados de libertad son versiones escaladas de las distribuciones Gamma con $x$ grados de libertad).