Gracias, whuber, por hacerme consciente de Wald es Secuencial Ratio de Probabilidad de la Prueba (SPRT). En su recomendación, voy a relist esta Habilidades Cuantitativas sitio. Ellos le darán un fuera-de-la-cuadro de tabla para determinar si continuar o detener la prueba.
También me tomé el tiempo para la investigación de ese sitio referencias, y fue dirigida hacia un completo artículo que está destinado a pruebas médicas, pero es fácilmente transferible a otros dominios. Es el Aumento de la Eficiencia en la Evaluación de la Investigación: El Uso de Análisis Secuencial (Howe, Holly L., Diario Americano de Salud Pública de julio de 1982, Vol. 72, Nº 7, pp 690-697.) Este artículo puede ser descargado en su totalidad.
Ya que no he visto SPRT en mis estadísticas cursos, voy a dar un libro de cocina que espero que útil para el stackexchange de la comunidad.
Para mi la hipótesis nula, he probado para un nivel de 95% de respuestas correctas. Si, sin embargo, el nivel estaba por debajo del 80%, sería una causa de preocupación. Por lo que tengo
$p_1 = .95$ (hipótesis nula), y $p_2 = .80$ (hipótesis alternativa)
Voy a utilizar $\alpha = 0.05$$\beta = 0.10$.
Howe se muestra un gráfico con dos líneas paralelas, con parcelas de los errores acumulativos. Las pruebas continúan, mientras que el acumulado de los errores (y en mi caso, el número acumulado de corregir los puntos de datos) se encuentran entre las dos líneas.
Si los errores acumulativos exceder de la línea, entonces:
- aceptar la hipótesis nula (si acumulativa cuenta del error cae por debajo de la línea inferior, $d_1$), o
- rechazar la hipótesis nula (si acumulativa número de errores supera la línea superior, $d_2$).
Aquí están las ecuaciones. Voy a añadir un denominador porque se utiliza varias veces.
$denom = log\left [ \left ( \frac{p_2}{p_1}\right )(\frac{1 - p_1}{1 - p_2}) \right ]$
Las pendientes de las líneas son las mismas, y representado por s.
$s = \frac{log\left ( \frac{1 - p_1}{1 - p_2} \right )}{denom}$
La intercepta, $h_1$$h_2$, se calcula de la siguiente manera:
$h_1 = \frac{log\left ( \frac{1 - \alpha }{\beta }\right )}{denom}$
$h_2 = \frac{log\left ( \frac{1 - \beta }{\alpha }\right )}{denom}$
Puedo configurar una hoja de cálculo con los datos del punto N va de 1 a 50. Luego he añadido dos columnas para el umbral de aceptación ($d_1$) y el rechazo de umbral ($d_2$).
$d_1 = -h_1 + sN$
$d_2 = h_2 + sN$
En mi experimento,
$denom = -0.67669$
$h_1 = -1.44485$
$h_2 = -1.85501$
Los valores de $d_1$ N=2, N=5, N=10 3.224, 5.893, 10.342.
Entonces agregué columnas para el éxito y cumSuccess. Tomé puntos de datos hasta que el número acumulado supera el umbral de aceptación, y de aceptar la hipótesis nula.