Intervalos de confianza de máxima verosimilitud
La aproximación normal a la muestra Bernoulli se basa en tener un tamaño de muestra relativamente grande y proporciones de muestra alejadas de las colas. La estimación de máxima verosimilitud se centra en las probabilidades transformadas en logaritmos y esto proporciona intervalos no simétricos y eficientes para $p$ que debería usarse en su lugar.
Defina las probabilidades logarítmicas como $\hat{\beta}_0 = \log(\hat{p}/(1-\hat{p}))$
A 1- $\alpha$ CI para $\beta_0$ está dada por:
$$\text{CI}(\beta_0)_\alpha = \hat{\beta}_0 \pm \mathcal{Z}_{\alpha/2} \sqrt{1/(n\hat{p}(1-\hat{p})}$$
Y esto se vuelve a transformar en un intervalo (no simétrico) para $p$ con:
$$\text{CI}(p)_\alpha = 1/(1+\exp(-\text{CI}(\beta_0)_\alpha)$$
Este IC tiene la ventaja añadida de que las proporciones se sitúan en el intervalo entre 0 o 1, y el IC es siempre más estrecho que el intervalo normal, a la vez que es del nivel correcto. Se puede obtener esto muy fácilmente en R especificando:
set.seed(123)
y <- rbinom(100, 1, 0.35)
plogis(confint(glm(y ~ 1, family=binomial)))
2.5 % 97.5 %
0.2795322 0.4670450
Intervalos de confianza binomiales exactos
En muestras pequeñas, la aproximación normal a la MLE -aunque mejor que la aproximación normal a la proporción de la muestra- puede no ser fiable. Eso está bien. $Y = n\hat{p}$ se puede considerar que sigue un binomio $(n,p)$ densidad. Los límites para $\hat{p}$ se puede encontrar tomando los percentiles 2,5 y 97,5 de esta distribución.
$$\text{CI}_\alpha = (F^{-1}_{\hat{p}}(0.025), F^{-1}_{\hat{p}}(0.975))$$
Raramente posible a mano, un exacto se puede obtener un intervalo de confianza binomial para $p$ utilizando métodos computacionales.
qbinom(p = c(0.025, 0.975), size = length(y), prob = mean(y))/length(y)
[1] 0.28 0.47
Mediana de los intervalos de confianza insesgados
Y si $p$ es 0 o 1 exactamente, se puede utilizar un estimador insesgado de la mediana para obtener estimaciones de intervalo no singulares basadas en la función de probabilidad insesgada de la mediana. Se puede tomar trivialmente el límite inferior del caso todo-0 como 0 WLOG. El límite superior es cualquier proporción $p_{1-\alpha/2}$ que satisface:
$$p_{1-\alpha/2} : P(Y = 0)/2 + P(Y > y) > 0.975$$
También se trata de una rutina computacional.
set.seed(12345)
y <- rbinom(100, 1, 0.01) ## all 0
cil <- 0
mupfun <- function(p) {
0.5*dbinom(0, 100, p) +
pbinom(1, 100, p, lower.tail = F) -
0.975
} ## for y=0 successes out of n=100 trials
ciu <- uniroot(mupfun, c(0, 1))$root
c(cil, ciu)
[1] 0.00000000 0.05357998 ## includes the 0.01 actual probability
Los dos últimos métodos se aplican en el epitools
en R.