7 votos

Predecir el número total de errores basado en el número de errores revelados por cada probador

Suponiendo que n evaluadores de forma independiente de pruebas de la misma aplicación para un período determinado. Cada probador de encontrar un conjunto de errores (Algunos de los errores fueron detectados por más de un tester).

Por ejemplo:

Probador de 1 encontrado errores {1,2,3,4,5} Tester 2 encontrado errores {3,5,6,7} Probador de 3 encontrado errores {1,3,5,8,9,10}

(El número de serie asignado a cada error una vez que es detectado por algunos tester, de acuerdo a la detección de la orden, sin embargo, los probadores son conscientes el uno del otro, y de la asignación de los números de serie.)

Suponiendo que todos los errores tienen la misma probabilidad de ser detectado.

(pero sin asumir que todos los probadores son igual de talentosos)

Puedo calcular la probabilidad de tener x errores no detectados? Cómo?

1voto

Alan Puntos 7273

Esta es una captura-recaptura pregunta, en este caso con más de dos visitas, brevemente discutido por la Wikipedia y en más detalle por el R viñeta en el paquete Rcapture

Su hipótesis de

  1. diferentes probadores tener diferentes habilidades ($t$)
  2. cada error sea la misma probabilidad de ser capturados (no $h$)
  3. la probabilidad de un error de estar atrapado no ser afectada por el hecho de que previamente fue capturado (no $b$)

sugiere una $M_t$ modelo. Utilizando el código R

library(Rcapture)
bugscaught <- matrix(c(1,1,1,1,1,0,0,0,0,0,
                       0,0,1,0,1,1,1,0,0,0,
                       1,0,1,0,1,0,0,1,1,1),ncol=3)
closedp(bugscaught)

da el siguiente

Number of captured units: 10 

Abundance estimations and model fits:
              abundance   stderr  deviance  df     AIC
M0                 13.1      3.1     6.781   5  23.614
Mt                 12.9      3.0     6.128   3  26.961
Mh Chao            26.3     20.9     2.472   4  21.305
Mh Poisson2       115.9    237.3     2.472   4  21.305
Mh Darroch        696.0   2253.0     2.472   4  21.305
Mh Gamma3.5      4565.3  19853.4     2.472   4  21.305
Mth Chao           25.6     20.0     1.708   2  24.541
Mth Poisson2      113.6    232.5     1.708   2  24.541
Mth Darroch       699.7   2266.0     1.708   2  24.541
Mth Gamma3.5     4714.8  20515.0     1.708   2  24.541
Mb                 16.7     13.7     6.526   4  25.359
Mbh                 1.0     13.6     5.751   3  26.584

y para un $M_t$ modelo sugiere una estimación central de 12.9 errores con una desviación estándar de 3, por lo que me gustaría sugerir un rango de 10 a algo así como el 20. Si quieres profundizar, a continuación, el contenido de closedp(bugscaught)$glm$Mt pueden tener información útil.

Como se puede ver, si en lugar de asumir algunos errores será más difícil que los demás a encontrar, a continuación, en función del modelo la estimación central podría llegar a los miles.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X