Tengo un prototipo de máquina de producción de piezas.
En una primera prueba, la máquina produce $N_1$ partes y un clasificador binario me dice que $d_1$ piezas son defectuosas ($d_1 < N_1$, generalmente de $d_1/N_1<0.01$$N_1\approx10^4$) y $N_1-d_1$ partes son buenas.
A continuación, un técnico hace algunos cambios en el equipo con el fin de disminuir el número de piezas defectuosas.
En una segunda y siguientes de la prueba de la modificación de la máquina produce $N_2$ partes y el mismo clasificador binario (virgen) me dice que $d_2$ piezas son defectuosas, de todos modos $d_2/N_2$ es bastante similar a $d_1/N_1$.
El técnico gustaría saber si sus cambios son efectivos.
Suponiendo que los clasificadores es perfecto (su sensibilidad es de 100% y su especificidad es del 100%), puedo realizar una prueba de proporciones (con R, me acabo de tipo prop.test(c(d1,d2),c(N1,N2))
).
Pero la clasificación no es perfecta, así que ¿cómo puedo tomar en cuenta la sensibilidad y la especificidad, tanto desconocido, de la clasificador en el fin de responder apropiadamente al técnico?