Creo que @onestop tenía la intuición correcta sobre la independencia de las proporciones. A continuación la justificación.
Dejemos que $(X_{11},X_{12},X_{21},X_{21})$ siguiendo la distribución multinomial bajo una probabilidad $\Pr$ (con $\Pr(X_{11}+X_{12}+X_{21}+X_{22}=N)=1$ ).
Sabemos que $(X_{12} \mid X_{11}+X_{12}=n_1) \sim \text{Bin}\left(n_1; \frac{\theta_{12}}{\theta_{11}+\theta_{12}}\right)$ y $(X_{21} \mid X_{21}+X_{22}=n_2) \sim \text{Bin}\left(n_2; \frac{\theta_{21}}{\theta_{21}+\theta_{22}}\right)$ . Tenemos que demostrar que $X_{12}$ y $X_{21}$ son independientes bajo una probabilidad condicional adecuada.
Dejemos que $n_1$ y $n_2$ sean números enteros tales que $n_1+n_2=N$ . Obviamente $\Pr(X_{12}=i \mid X_{11}+X_{12}=n_1, X_{21}+X_{22}=n_2) = \Pr(X_{12}=i \mid X_{11}+X_{12}=n_1)$ y $\Pr(X_{21}=j \mid X_{11}+X_{12}=n_1, X_{21}+X_{22}=n_2) = \Pr(X_{21}=j \mid X_{21}+X_{22}=n_2)$ .
En segundo lugar, $X_{12}$ y $X_{21}$ son condicionalmente independientes dado el evento $\{X_{11}+X_{12}=n_1, X_{21}+X_{22}=n_2\}$ . En efecto, mediante el álgebra elemental, no es difícil comprobar que la igualdad intuitiva $$\Pr(X_{12}=i \mid X_{21}=j, X_{11}+X_{12}=n_1, X_{21}+X_{22}=n_2) = \Pr(X_{12}=i \mid X_{11}+X_{12}=n_1)$$ es cierto (esto es más fácil si se sabe de antemano que $(X_{12} \mid X_{11}+X_{12}=n_1) \sim \text{Bin}\left(n_1; \frac{\theta_{12}}{\theta_{11}+\theta_{12}}\right)$ ).
Eso demuestra que $X_{12}$ y $X_{21}$ son independientes y se distribuyen según $\text{Bin}\left(n_1; \frac{\theta_{12}}{\theta_{11}+\theta_{12}}\right)$ y $\text{Bin}\left(n_2; \frac{\theta_{21}}{\theta_{21}+\theta_{22}}\right)$ respectivamente bajo la probabilidad condicional $\Pr(\cdot \mid X_{11}+X_{12}=n_1, X_{21}+X_{22}=n_2)$ .
(EDIT). El intervalo de Newcombe está disponible en el paquete R pairwiseCI. A continuación se presentan algunas simulaciones que muestran la cobertura real del $95\%$ -intervalo de confianza en función de $\theta_{12}$ cuando arreglo $N=288$ , $\theta_{11}=0.3$ , $\theta_{22}=0.4$ .
library(pairwiseCI)
N <- 288
theta11 <- 0.3
theta22 <- 0.4
nsims <- 10000
vtheta12 <- seq(0,1-theta11-theta22,le=51)
coverage <- rep(0,length(vtheta12))
for(i in 1:length(vtheta12)){
theta12 <- vtheta12[i]
theta21 <- 1-(theta11+theta12+theta22)
FPR <- theta12/(theta11+theta12)
FNR <- theta21/(theta21+theta22)
diff <- FPR-FNR
cover <- 0
for(k in 1:nsims){
tab <- rmultinom(1, N, c(theta11,theta12,theta21,theta22))
bounds <- Prop.diff(x=rev(c(tab[1],tab[2])),y=c(tab[3],tab[4]),CImethod="NHS")$conf.int
cover <- cover + ((bounds[1]< diff) & (bounds[2]> diff))
}
coverage[i] <- 100*cover/nsims
}
plot(vtheta12, coverage, type="l",
xlab="theta12", ylab="coverage (%)")
abline(h=95, lty="dashed")
0 votos
No tengo esto como una respuesta completa pero te daré mi enfoque. Sea Ph=X12/TFp y Qh=x21/TFe donde TFp=(x21+x22). Entonces trataría de construir el intervalo de confianza utilizando Ph-Qh. Ni siquiera he pensado en cómo construir una cantidad pivote a partir de esto. El corte para el intervalo de confianza se basaría en la multinomial para (x11, x12, x21, x22) teniendo en cuenta que la multinomial tiene la restricción x11+x12+x21+x22=N donde N es el tamaño total de la muestra. También estaba pensando en condicionar los totales marginales y ver cómo quedaría un IC condicional.