4 votos

¿Cómo calcular el margen de error de un experimento de control de calidad binomial en el que sólo se observan los aciertos (incluido el FPC)?

Wikipedia Margen de error La entrada dice que

una muestra aleatoria de tamaño 400 dará un margen de error, con un nivel de confianza del 95%, de 0. de confianza, de 0,98/20 o 0,049, es decir, algo menos del 5%.

dado un tamaño de población infinito. Esto significa que si yo encuestara a 400 ciudadanos estadounidenses (seleccionados al azar) y les preguntara "¿Obama o Romney?", la proporción resultante sería exacta con un nivel de confianza del 95%, con un margen de error inferior al 5%.

Sin embargo, ¿puedo utilizar este mismo cálculo para comprobar que un programa informático es capaz de manejar aproximadamente todas las entradas?

Por ejemplo: Tengo una población infinita de usuarios, necesito estar seguro (con un 95% de confianza, dado un 5% de error) de que mi software será capaz de idear un apodo para todos ellos basándose en su nombre y en un simple algoritmo.

Si selecciono aleatoriamente a 400 usuarios, y el algoritmo de apodos funciona perfectamente para los 400 usuarios, ¿puedo asumir (con un 95% de confianza, dado un 5% de error) que mi algoritmo es válido para toda la población? ¿Es ésta la forma incorrecta de calcular el margen de error para este tipo de problema?

24voto

mat_geek Puntos 1367

Un método, utilizado para probar la Resultado de París-Harrington Una declaración de la teoría de Ramsey que es independiente de PA, funciona aproximadamente como sigue. El enunciado a demostrar tiene la forma $\forall n\ \exists k\ \varphi(n,k)$ . Así, si se considera la función $f$ asignando a cada uno de ellos $n$ al menor testigo $k$ Lo que la afirmación equivale a la afirmación de que $f$ es una función total, que $f(n)$ se define para todos los $n$ .

Ahora bien, la función que surge en el resultado de Paris-Harrington es una función de crecimiento enormemente rápido, de crecimiento alucinante. La forma en que el argumento funciona, muy aproximadamente, es trabajar en un modelo no estándar $M$ de PA, pero encontrar un segmento inicial $I\lt M$ , un corte, tal que $f$ salta sobre el corte $I$ pero de manera que $I$ sigue satisfaciendo a la AP de todos modos. Así, en el modelo $I$ la función $f$ es no total, y así se tiene el modelo deseado donde la afirmación es falsa.

3voto

Ted Puntos 854

El cálculo de 0,049 de Wikipedia sólo se aplica si la probabilidad de éxito es de 0,5 ( $1.96\times\sqrt{\frac{0.5\times0.5}{400}}$ ). Este no es el caso en su situación; pero la buena noticia es que a medida que la probabilidad de éxito se acerca a cero o a uno, el margen de error para cualquier tamaño de muestra particular se reduce.

Usted está interesado en estimar la probabilidad de éxito (llamémosla $p$ ) y, en particular, un intervalo de confianza del 95 por ciento para el mismo.

La posibilidad de no ver fallos en $n$ los experimentos es $p^n$ por lo que, por ejemplo, si se establece 0,99 como posible valor de $p$ la posibilidad de ver 400 éxitos es sólo $0.99^{400}=0.017$ . Esto es bastante pequeño, por lo que normalmente diríamos que esto es una prueba en contra de que p sea tan bajo como 0,99, mientras que es perfectamente consistente con p=1, que es lo que usted quiere. Pero es posible que p sea tan alta como (por ejemplo) 0,999, porque el 67% de las veces, si p=0,999, 400 ensayos aleatorios serán todos exitosos, aunque esto podría ser una tasa de éxito inaceptablemente baja para la población total.

Para abreviar, si tiene una serie de éxitos puede estimar un intervalo de confianza del 95 por ciento con ( $e^{(\frac{log(0.05)}{n})}, 1]$ . Por tanto, si se introduce el valor de n=400 (porque se han obtenido 400 aciertos), el intervalo de confianza es (0,9925, 1]. Es usted quien debe determinar si una tasa de éxito que podría ser tan baja como 0,9925 es lo suficientemente buena para sus fines.

EDITAR - adición sobre la población finita

En mis comentarios señalé que la fórmula anterior para el límite inferior del intervalo de confianza procedía de resolver $0.05=p^n$ para $p$ . Si tienes una población finita, tienes el reto más complejo de resolver la ecuación de abajo para p:

$0.05=\frac{Np}{N}\times \frac{Np-1}{N-1}\times ... \frac{Np-n+1}{N-n+1}$

Puede haber una solución para esto, pero me pareció más fácil escribir una función en R que lo hace por mí de forma iterativa, y devuelve un intervalo de (0,9945, 1] si tiene 400 ensayos de una población finita de 1000. La función test() a continuación se puede utilizar para cualquier combinación de número de ensayos y tamaño de la población.

tmp <- function(N,n,p){
    x <- 1
    f <- round(N*p)
    for (i in 0:(n-1)){
        x <- x * (f-i) / (N-i)
    }
x
}

test <- function(N,n){
    p <- exp(log(0.05)/n) # start with infinite N
    incr <- n/N * 0.00001
    x <- tmp(N, n,p)
    while(x <0.05){
    x <- tmp(N, n,p)
    p <- p + incr
    }
p
}

> test(10^10,400)
[1] 0.9925386
> test(1000,400)
[1] 0.9945066
> test(450,400)
[1] 0.9966809

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X