6 votos

Valor de p en un problema sobre la gente va a un espectáculo con cierta probabilidad de computación

Estoy teniendo problemas para entender esta pregunta desde mi estadística de la clase:

Me entregó un folleto sobre un concierto de rock a 20 personas que, en ese momento, no había planeado asistir a la feria. Mi hipótesis es que 5 o más personas ahora están yendo al concierto de rock. Me decidí a seguir con 8 de ellos (elegido al azar) para ver si iban a la feria. Me parece que 2 de esos 8 personas acudieron a la feria. ¿Cuál es el p-valor del resultado de mi experimento?

¿Qué tipo de prueba estadística es necesario encontrar el valor de p?

9voto

jldugger Puntos 7490

Esta pregunta tiene una única respuesta: nada más va a ser sólo una aproximación o estará basado en la inferior, prueba de hipótesis. El p-valor es $682/969 \approx 70.4\%$. Su cálculo se basa en el muestreo sin reemplazo de una población de $20$. El resto de este post proporciona el razonamiento, que se basa sólo en la definición de la p-valor y algunos sencillos cálculos combinatorios.


Un modelo de probabilidad para los resultados pueden ser descritos por un cuadro de con $20$ entradas, una por persona. En cada entrada está escrita ya sea que la persona se fue a la feria. Su muestra aleatoria es como tomar ocho de las entradas fuera de la caja (sin sustitución).

Las características estadísticas de este modelo, las cuales son aún desconocidos son completamente determinado por el número de personas que acudió a este espectáculo. Llame a este número $\theta$. Los posibles valores de $\theta$ son los números enteros de cero a $20$.

Su hipótesis nula, $H_0$, es que con cinco o más personas acudieron a la feria: $\theta \ge 5$. La alternativa es que el $\theta \lt 5$.

Para probar esta hipótesis, la única utilidad de la estadística es el recuento $X$ de las personas en la muestra que fue a la feria. (Contar a los que no ir a dar matemáticamente equivalente a la información, obviamente.) Evidentemente pequeños valores de $X$ se evidencia en contra de $H_0$ y los grandes valores son evidencia de ello. De hecho, si $X \ge 5$, que sería cierto que $H_0$ es cierto, porque al menos cinco personas en su muestra fue.

El p-valor se calcula a partir de la posibilidad de que $X$ podría haber sido menor o igual que el valor observado, que fue $2$. Esta oportunidad puede ser fácilmente calculada por la ruptura en tres mutuamente excluyentes posibilidades:

  • $X=0$ significa que la totalidad de la muestra de $8$ boletos de vino de la $20-\theta$ no-show-va de boletos en la caja. Hay $\binom{20-\theta}{8}$ formas en que podría suceder.

  • $X=1$ significa que siete de los tickets de muestra provenía de la $20-\theta$ no-show-va de entradas (hay $\binom{20-\theta}{7}$ formas para que eso suceda) y un vino de la $\theta$ show-va boletos: hay $\binom{\theta}{1}$ formas para que eso suceda, independientemente de la elección de los otros siete entradas. El número total de este tipo de muestras, por tanto, es $\binom{20-\theta}{7}\binom{\theta}{1}$.

  • Un análogo argumento muestra que hay $\binom{20-\theta}{6}\binom{\theta}{2}$ de muestras con $X=2$ show-va boletos.

Añadir los tres valores y dividir por el número total de posibles (y equiprobables) muestras de, $\binom{20}{8}$, para obtener las probabilidades de $X\le 2$ en términos de lo desconocido $\theta$. A pesar de que como resulta que sólo es necesario realizar este cálculo para $\theta=5$, aquí son las posibilidades para que algunos de los otros valores de$\theta$, por lo que se puede apreciar los patrones:

$$ \begin{array}{rr|cccccc} &\theta & 2 & 3 & 4 & \color{Red} 5 & \color{Red} 6 & \color{Red} \cdots & \color{Red} {14} \\ &\text{Probability} & 1 & \frac{271}{285} & \frac{4103}{4845} & \color{Red}{\frac{682}{969}} & \color{Red}{\frac{176}{323}} & \color{Red}\cdots & \color{Red}{\frac{7}{9690}} \\ &\text{(in decimals)} & 1. & 0.951 & 0.847 & \color{Red} {0.704} & \color{Red} {0.545} & \color{Red}\cdots & \color{Red} {0.001}\\ \end{array} $$

(Empecé la tabla de $\theta=2$ debido a que ya se observó en dos de mostrar a los asistentes en su muestra. Acabé en $\theta=14$ debido a que ya se observan seis no mostrar a los asistentes, dejando en la mayoría de las $20-6=14$ mostrar a los asistentes.)

Al $\theta$ es pequeña (que está bajo la hipótesis alternativa, que consiste sólo de las posibilidades $\{0,1,2,3,4\}$), la posibilidad de que $X\le 2$ es alta. Pero como $\theta$ aumenta, la probabilidad disminuye. Entre la hipótesis nula, que comprende los casos de $\theta=5, 6, \ldots, 20$ (tabulados en rojo), el mayor riesgo se produce cuando $\theta=5$, donde es $682/969 \approx 0.704$. Este es el p-valor.

Vamos a interpretar esta conclusión para comprobar que tiene sentido. El relato podría ir así:

Quiero probar si hay cinco o más-va de boletos en la caja. Un pequeño número de show-vamos entradas en mi ejemplo sería la evidencia en contra de eso. Vi sólo dos show-va de boletos en la muestra. Allí, en realidad, es una situación, es decir, donde exactamente cinco de las veinte personas acudieron a la feria, en el que la posibilidad de observar dos o menos entradas en mi muestra es tan grande como $70.4\%$. Esta es muy alta, mostrando mi muestra es consistente con la hipótesis nula.


Como una comprobación adicional de este razonamiento, se considera un escenario en el que la muestra debe tener un bajo nivel de p-valor. Suponga que la hipótesis nula se que más de la mitad de los 20 personas acudieron a la feria. El correspondiente conjunto de posibles valores de$\theta$$H_0 = \{11, 12, \ldots, 20\}$. La mayor probabilidad de que $X\le 2$ para cualquiera de estas situaciones se produce cuando $\theta=11$ y es sólo $4\%$ ($335/8398$). Que un muy bajo valor de p, lo que permite a la conclusión de que es probable que haya menos de $11$ show-va de boletos en la caja. De hecho, usted ha visto sólo dos de ellos y hay sólo $12$ boletos a la izquierda en el cuadro, así que debes estar seguro de que hay menos de nueve mostrar curso entradas entre ellos. Dado que sólo una cuarta parte de la muestra contiene show-va boletos, eso es una conclusión razonable.

2voto

Neal Puntos 316

Creo que esta tarea es una pregunta un poco claro.

El experimento parece estar repartiendo el folleto para una población de $20$ de la gente. Quieres saber cuál es la probabilidad de que $5$ $20$de personas que asisten como resultado. Generalmente, los experimentos consisten en un grupo de control que recibe un placebo, pero tal vez esta es una nueva banda que nadie conoce, por lo que la suposición de que nadie planes para asistir en la ausencia del tratamiento de viajero es razonable. O tal vez los organizadores gustó mucho este estudio. El segundo supuesto es que los volantes no puede ser compartida, por lo que el tratamiento no es "contagiosa". Esto es menos razonable, pero complicaría el problema demasiado para relajarse. En cualquier caso, si se piensa en un experimento como un procedimiento llevado a cabo para verificar, refutar o validar una hipótesis, esta se ajusta a la ley.

El problema es que usted no sabe que la tasa de aceptación en la población. Para aprender, que muestra $8$ receptores al azar de la población de $20$, y tenga en cuenta que $2$ fue. La incidencia parece ser $1/4$. Usted podría incluso hacer una prueba binomial aquí y encuentra que usted no puede rechazar la nula de que $p=0.25$, como en el @E L M a responder.

El objetivo final, sin embargo, es la extrapolación de la muestra a la población de 20, que es el experimento. La probabilidad de que $5$ o más personas asisten al repartir $20$ volantes puede ser calculado por el binomio función de cola, lo que le da su la probabilidad de observar $k=5$ o más éxitos en $20$ ensayos, cuando la probabilidad de un éxito en una prueba es $p=\frac{1}{4}$. En Stata, esto sería:

. display binomialtail(20,5,1/4)
.5851585

Usted puede hacer esto a partir de primeros principios restando $1 - Pr(k=0)-Pr(k=1)-Pr(k=2)-Pr(k=3)-Pr(k=4)$:

 di 1-[binomialp(20,0,1/4)+binomialp(20,1,1/4)+binomialp(20,2,1/4)+binomialp(20,3,1/4)+binomialp(20,4,1/4)]
.5851585

También se podría pensar en esto como un solo lado binomial de probabilidad de la prueba:

. bitesti 20 5 1/4

        N   Observed k   Expected k   Assumed p   Observed p
------------------------------------------------------------
       20          5            5       0.25000      0.25000

  Pr(k >= 5)           = 0.585158  (one-sided test)
  Pr(k <= 5)           = 0.617173  (one-sided test)
  Pr(k <= 5 or k >= 6) = 1.000000  (two-sided test)

La primera cara de la prueba le da la misma probabilidad como la cola de enfoque. También es un p-valor. Por qué?

El valor p de una prueba de hipótesis es la probabilidad (calculado asumiendo $H_0$ es cierto) de la observación de cualquier resultado tan extremo o más extremo que el resultado observado $(k=5)$, con extremos significado en la dirección de la hipótesis alternativa. Se rechaza la nula cuando el valor p es pequeño, en favor de la alternativa, porque nada tan extremo o más es muy probable si el null era cierto. No acepta la nula, sin embargo, los datos sólo pueden ser consecuente con ella.

En R, esto se puede hacer con:

> binom.test(5,20,1/4, alternative = "greater")

        Exact binomial test

data:  5 and 20
number of successes = 5, number of trials = 20, p-value = 0.5852
alternative hypothesis: true probability of success is greater than 0.25
95 percent confidence interval:
 0.1040808 1.0000000
sample estimates:
probability of success 
                  0.25 

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X