5 votos

Diseño del experimento para la proporción

Me gustaría probar la hipótesis de que una base de datos que contiene los datos que son correctos en el 95% o más de las muestras.

He encontrado esta prueba de Hipótesis para una proporción diseño de experimento que parecía apropiado.

Voy al azar muestras de una décima parte de la población y de la marca de cada dato como correcta o incorrecta.

Aquí está un resumen del diseño:

  1. Estado de la hipótesis: (Hipótesis Nula: P >= 0.95, Alternativa: P < 0.95)
  2. Formular un plan de análisis (nivel de Significación es de 0,05)
  3. Analizar los datos de la muestra (calcular el σ y calcular la puntuación z del estadístico de prueba (z))
  4. La interpretación de los resultados (Rechazar la hipótesis nula si el P-valor es menor que el nivel de significación (0.05).)

Tengo un puñado de preguntas:

  1. Es esta una prueba adecuada para utilizar si no hay ninguna magnitud de error (sólo que el dato es correcto o no)?
  2. El StatTrek página dice que se detiene después de 10 aciertos y 10 errores, pero la muestra no más de 10% de la población. Son 10, 10 y 10 sólo útil reglas de pulgar, o hay algún otro principio rector?

2voto

Ronnie Overby Puntos 246

Gracias, whuber, por hacerme consciente de Wald es Secuencial Ratio de Probabilidad de la Prueba (SPRT). En su recomendación, voy a relist esta Habilidades Cuantitativas sitio. Ellos le darán un fuera-de-la-cuadro de tabla para determinar si continuar o detener la prueba.

También me tomé el tiempo para la investigación de ese sitio referencias, y fue dirigida hacia un completo artículo que está destinado a pruebas médicas, pero es fácilmente transferible a otros dominios. Es el Aumento de la Eficiencia en la Evaluación de la Investigación: El Uso de Análisis Secuencial (Howe, Holly L., Diario Americano de Salud Pública de julio de 1982, Vol. 72, Nº 7, pp 690-697.) Este artículo puede ser descargado en su totalidad.

Ya que no he visto SPRT en mis estadísticas cursos, voy a dar un libro de cocina que espero que útil para el stackexchange de la comunidad.

Para mi la hipótesis nula, he probado para un nivel de 95% de respuestas correctas. Si, sin embargo, el nivel estaba por debajo del 80%, sería una causa de preocupación. Por lo que tengo

$p_1 = .95$ (hipótesis nula), y $p_2 = .80$ (hipótesis alternativa)

Voy a utilizar $\alpha = 0.05$$\beta = 0.10$.

Howe se muestra un gráfico con dos líneas paralelas, con parcelas de los errores acumulativos. Las pruebas continúan, mientras que el acumulado de los errores (y en mi caso, el número acumulado de corregir los puntos de datos) se encuentran entre las dos líneas.

Si los errores acumulativos exceder de la línea, entonces:

  • aceptar la hipótesis nula (si acumulativa cuenta del error cae por debajo de la línea inferior, $d_1$), o
  • rechazar la hipótesis nula (si acumulativa número de errores supera la línea superior, $d_2$).

Aquí están las ecuaciones. Voy a añadir un denominador porque se utiliza varias veces.

$denom = log\left [ \left ( \frac{p_2}{p_1}\right )(\frac{1 - p_1}{1 - p_2}) \right ]$

Las pendientes de las líneas son las mismas, y representado por s.

$s = \frac{log\left ( \frac{1 - p_1}{1 - p_2} \right )}{denom}$

La intercepta, $h_1$$h_2$, se calcula de la siguiente manera:

$h_1 = \frac{log\left ( \frac{1 - \alpha }{\beta }\right )}{denom}$

$h_2 = \frac{log\left ( \frac{1 - \beta }{\alpha }\right )}{denom}$

Puedo configurar una hoja de cálculo con los datos del punto N va de 1 a 50. Luego he añadido dos columnas para el umbral de aceptación ($d_1$) y el rechazo de umbral ($d_2$).

$d_1 = -h_1 + sN$

$d_2 = h_2 + sN$

En mi experimento,

$denom = -0.67669$

$h_1 = -1.44485$

$h_2 = -1.85501$

Los valores de $d_1$ N=2, N=5, N=10 3.224, 5.893, 10.342.

Entonces agregué columnas para el éxito y cumSuccess. Tomé puntos de datos hasta que el número acumulado supera el umbral de aceptación, y de aceptar la hipótesis nula.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X