4 votos

Intervalo de confianza sobre la diferencia entre las proporciones de falsos positivos y falsos negativos

Consideremos un multinomio $2\times 2$ tabla $\begin{pmatrix} x_{11} & x_{12} \\ x_{21} & x_{22} \end{pmatrix}$ con probabilidades teóricas: $$\begin{pmatrix} \theta_{11} & \theta_{12} \\ \theta_{21} & \theta_{22} \end{pmatrix}.$$

Llamemos $p:=\dfrac{\theta_{12}}{\theta_{11}+\theta_{12}}$ la proporción de "falsos positivos" y $q:=\dfrac{\theta_{21}}{\theta_{21}+\theta_{22}}$ la propoción de "falso negativo". Tenga en cuenta que $p$ es el parámetro de proporción de la distribución condicional binomial de $x_{12}$ dado $x_{11}+x_{12}$ y de manera similar $q$ es el parámetro de proporción de la distribución condicional binomial de $x_{21}$ dado $x_{21}+x_{22}$ .

Estoy buscando un intervalo de confianza frecuentista sobre la diferencia $p-q$ . Alternativamente también me interesa un intervalo de confianza bayesiano siempre que su nivel de confianza sea lo suficientemente cercano a su nivel de credibilidad (he comprobado en algunos ejemplos que el intervalo de credibilidad de Jeffreys es un poco demasiado anticonservador).

0 votos

No tengo esto como una respuesta completa pero te daré mi enfoque. Sea Ph=X12/TFp y Qh=x21/TFe donde TFp=(x21+x22). Entonces trataría de construir el intervalo de confianza utilizando Ph-Qh. Ni siquiera he pensado en cómo construir una cantidad pivote a partir de esto. El corte para el intervalo de confianza se basaría en la multinomial para (x11, x12, x21, x22) teniendo en cuenta que la multinomial tiene la restricción x11+x12+x21+x22=N donde N es el tamaño total de la muestra. También estaba pensando en condicionar los totales marginales y ver cómo quedaría un IC condicional.

4voto

Berek Bryan Puntos 349

Por lo que veo (perdóname si me equivoco), $p$ y $q$ son independiente proporciones, por lo que se busca un intervalo de confianza para la diferencia entre dos proporciones independientes. Robert Newcombe realizó una comparación de varios métodos para construir dichos intervalos:

Newcombe RG. Estimación de intervalos para la diferencia entre proporciones independientes: comparación de once métodos. Estadísticas en medicina 1998; 17(8):873-890.

Descubrió que el método más sencillo y con buen rendimiento era el que consistía en combinar los intervalos de puntuación de Wilson para las dos proporciones ("Método 10" en el documento anterior).

Newcombe escribió una hoja de cálculo de Excel que implementa sus fórmulas recomendadas para este y otros IC de varias estimaciones que implican proporciones, disponible en http://medicine.cf.ac.uk/primary-care-public-health/resources/ .

1 votos

Su punto principal es la independencia entre $p$ et $q$ . Hablando con rigor, eso significaría: 1) $x_{12}$ es condicionalmente independiente de $x_{21}+x_{22}$ dado $(x_{11}+x_{12},x_{21}+x_{22})$ ; 2) $x_{21}$ es condicionalmente independiente de $x_{11}+x_{12}$ dado $(x_{11}+x_{12},x_{21}+x_{22})$ ; 3) $x_{12}$ et $x_{21}$ son condicionalmente independientes dado $(x_{11}+x_{12},x_{21}+x_{22})$ . Estoy cansado, ¿tengo razón? Y si tengo razón, ¿es cierto?

1 votos

Yo también estoy cansado y me siento más inseguro que antes, así que espero que un tercero confirme o desmienta.

2voto

Ηλίας Puntos 109

Creo que @onestop tenía la intuición correcta sobre la independencia de las proporciones. A continuación la justificación.

Dejemos que $(X_{11},X_{12},X_{21},X_{21})$ siguiendo la distribución multinomial bajo una probabilidad $\Pr$ (con $\Pr(X_{11}+X_{12}+X_{21}+X_{22}=N)=1$ ).

Sabemos que $(X_{12} \mid X_{11}+X_{12}=n_1) \sim \text{Bin}\left(n_1; \frac{\theta_{12}}{\theta_{11}+\theta_{12}}\right)$ y $(X_{21} \mid X_{21}+X_{22}=n_2) \sim \text{Bin}\left(n_2; \frac{\theta_{21}}{\theta_{21}+\theta_{22}}\right)$ . Tenemos que demostrar que $X_{12}$ y $X_{21}$ son independientes bajo una probabilidad condicional adecuada.

Dejemos que $n_1$ y $n_2$ sean números enteros tales que $n_1+n_2=N$ . Obviamente $\Pr(X_{12}=i \mid X_{11}+X_{12}=n_1, X_{21}+X_{22}=n_2) = \Pr(X_{12}=i \mid X_{11}+X_{12}=n_1)$ y $\Pr(X_{21}=j \mid X_{11}+X_{12}=n_1, X_{21}+X_{22}=n_2) = \Pr(X_{21}=j \mid X_{21}+X_{22}=n_2)$ .

En segundo lugar, $X_{12}$ y $X_{21}$ son condicionalmente independientes dado el evento $\{X_{11}+X_{12}=n_1, X_{21}+X_{22}=n_2\}$ . En efecto, mediante el álgebra elemental, no es difícil comprobar que la igualdad intuitiva $$\Pr(X_{12}=i \mid X_{21}=j, X_{11}+X_{12}=n_1, X_{21}+X_{22}=n_2) = \Pr(X_{12}=i \mid X_{11}+X_{12}=n_1)$$ es cierto (esto es más fácil si se sabe de antemano que $(X_{12} \mid X_{11}+X_{12}=n_1) \sim \text{Bin}\left(n_1; \frac{\theta_{12}}{\theta_{11}+\theta_{12}}\right)$ ).

Eso demuestra que $X_{12}$ y $X_{21}$ son independientes y se distribuyen según $\text{Bin}\left(n_1; \frac{\theta_{12}}{\theta_{11}+\theta_{12}}\right)$ y $\text{Bin}\left(n_2; \frac{\theta_{21}}{\theta_{21}+\theta_{22}}\right)$ respectivamente bajo la probabilidad condicional $\Pr(\cdot \mid X_{11}+X_{12}=n_1, X_{21}+X_{22}=n_2)$ .

(EDIT). El intervalo de Newcombe está disponible en el paquete R pairwiseCI. A continuación se presentan algunas simulaciones que muestran la cobertura real del $95\%$ -intervalo de confianza en función de $\theta_{12}$ cuando arreglo $N=288$ , $\theta_{11}=0.3$ , $\theta_{22}=0.4$ .

library(pairwiseCI)

N <- 288
theta11 <- 0.3
theta22 <- 0.4

nsims <- 10000
vtheta12 <- seq(0,1-theta11-theta22,le=51)
coverage <- rep(0,length(vtheta12))
for(i in 1:length(vtheta12)){
    theta12 <- vtheta12[i]
    theta21 <-  1-(theta11+theta12+theta22)
    FPR <- theta12/(theta11+theta12)
    FNR <- theta21/(theta21+theta22) 
    diff <- FPR-FNR
    cover <- 0
    for(k in 1:nsims){
        tab <- rmultinom(1, N, c(theta11,theta12,theta21,theta22))
        bounds <- Prop.diff(x=rev(c(tab[1],tab[2])),y=c(tab[3],tab[4]),CImethod="NHS")$conf.int
        cover <- cover + ((bounds[1]< diff) & (bounds[2]> diff))
    }
    coverage[i] <- 100*cover/nsims
}

plot(vtheta12, coverage, type="l", 
    xlab="theta12", ylab="coverage (%)") 
abline(h=95, lty="dashed")

coverage

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X