Esta pregunta tiene una única respuesta: nada más va a ser sólo una aproximación o estará basado en la inferior, prueba de hipótesis. El p-valor es $682/969 \approx 70.4\%$. Su cálculo se basa en el muestreo sin reemplazo de una población de $20$. El resto de este post proporciona el razonamiento, que se basa sólo en la definición de la p-valor y algunos sencillos cálculos combinatorios.
Un modelo de probabilidad para los resultados pueden ser descritos por un cuadro de con $20$ entradas, una por persona. En cada entrada está escrita ya sea que la persona se fue a la feria. Su muestra aleatoria es como tomar ocho de las entradas fuera de la caja (sin sustitución).
Las características estadísticas de este modelo, las cuales son aún desconocidos son completamente determinado por el número de personas que acudió a este espectáculo. Llame a este número $\theta$. Los posibles valores de $\theta$ son los números enteros de cero a $20$.
Su hipótesis nula, $H_0$, es que con cinco o más personas acudieron a la feria: $\theta \ge 5$. La alternativa es que el $\theta \lt 5$.
Para probar esta hipótesis, la única utilidad de la estadística es el recuento $X$ de las personas en la muestra que fue a la feria. (Contar a los que no ir a dar matemáticamente equivalente a la información, obviamente.) Evidentemente pequeños valores de $X$ se evidencia en contra de $H_0$ y los grandes valores son evidencia de ello. De hecho, si $X \ge 5$, que sería cierto que $H_0$ es cierto, porque al menos cinco personas en su muestra fue.
El p-valor se calcula a partir de la posibilidad de que $X$ podría haber sido menor o igual que el valor observado, que fue $2$. Esta oportunidad puede ser fácilmente calculada por la ruptura en tres mutuamente excluyentes posibilidades:
$X=0$ significa que la totalidad de la muestra de $8$ boletos de vino de la $20-\theta$ no-show-va de boletos en la caja. Hay $\binom{20-\theta}{8}$ formas en que podría suceder.
$X=1$ significa que siete de los tickets de muestra provenía de la $20-\theta$ no-show-va de entradas (hay $\binom{20-\theta}{7}$ formas para que eso suceda) y un vino de la $\theta$ show-va boletos: hay $\binom{\theta}{1}$ formas para que eso suceda, independientemente de la elección de los otros siete entradas. El número total de este tipo de muestras, por tanto, es $\binom{20-\theta}{7}\binom{\theta}{1}$.
Un análogo argumento muestra que hay $\binom{20-\theta}{6}\binom{\theta}{2}$ de muestras con $X=2$ show-va boletos.
Añadir los tres valores y dividir por el número total de posibles (y equiprobables) muestras de, $\binom{20}{8}$, para obtener las probabilidades de $X\le 2$ en términos de lo desconocido $\theta$. A pesar de que como resulta que sólo es necesario realizar este cálculo para $\theta=5$, aquí son las posibilidades para que algunos de los otros valores de$\theta$, por lo que se puede apreciar los patrones:
$$
\begin{array}{rr|cccccc}
&\theta & 2 & 3 & 4 & \color{Red} 5 & \color{Red} 6 & \color{Red} \cdots & \color{Red} {14} \\
&\text{Probability} & 1 & \frac{271}{285} & \frac{4103}{4845} & \color{Red}{\frac{682}{969}} & \color{Red}{\frac{176}{323}} & \color{Red}\cdots & \color{Red}{\frac{7}{9690}} \\
&\text{(in decimals)} & 1. & 0.951 & 0.847 & \color{Red} {0.704} & \color{Red} {0.545} & \color{Red}\cdots & \color{Red} {0.001}\\
\end{array}
$$
(Empecé la tabla de $\theta=2$ debido a que ya se observó en dos de mostrar a los asistentes en su muestra. Acabé en $\theta=14$ debido a que ya se observan seis no mostrar a los asistentes, dejando en la mayoría de las $20-6=14$ mostrar a los asistentes.)
Al $\theta$ es pequeña (que está bajo la hipótesis alternativa, que consiste sólo de las posibilidades $\{0,1,2,3,4\}$), la posibilidad de que $X\le 2$ es alta. Pero como $\theta$ aumenta, la probabilidad disminuye. Entre la hipótesis nula, que comprende los casos de $\theta=5, 6, \ldots, 20$ (tabulados en rojo), el mayor riesgo se produce cuando $\theta=5$, donde es $682/969 \approx 0.704$. Este es el p-valor.
Vamos a interpretar esta conclusión para comprobar que tiene sentido. El relato podría ir así:
Quiero probar si hay cinco o más-va de boletos en la caja. Un pequeño número de show-vamos entradas en mi ejemplo sería la evidencia en contra de eso. Vi sólo dos show-va de boletos en la muestra. Allí, en realidad, es una situación, es decir, donde exactamente cinco de las veinte personas acudieron a la feria, en el que la posibilidad de observar dos o menos entradas en mi muestra es tan grande como $70.4\%$. Esta es muy alta, mostrando mi muestra es consistente con la hipótesis nula.
Como una comprobación adicional de este razonamiento, se considera un escenario en el que la muestra debe tener un bajo nivel de p-valor. Suponga que la hipótesis nula se que más de la mitad de los 20 personas acudieron a la feria. El correspondiente conjunto de posibles valores de$\theta$$H_0 = \{11, 12, \ldots, 20\}$. La mayor probabilidad de que $X\le 2$ para cualquiera de estas situaciones se produce cuando $\theta=11$ y es sólo $4\%$ ($335/8398$). Que un muy bajo valor de p, lo que permite a la conclusión de que es probable que haya menos de $11$ show-va de boletos en la caja. De hecho, usted ha visto sólo dos de ellos y hay sólo $12$ boletos a la izquierda en el cuadro, así que debes estar seguro de que hay menos de nueve mostrar curso entradas entre ellos. Dado que sólo una cuarta parte de la muestra contiene show-va boletos, eso es una conclusión razonable.