1 votos

Prueba de hipótesis de proporciones de dos muestras: regla de 10 éxitos y fracasos

Estoy aprendiendo la prueba de hipótesis con dos proporciones de muestra. Supongamos que los tamaños de muestra y el número de éxitos son ($n_1, y_1$) y ($n_2, y_2$), para las dos muestras, respectivamente. Deje que las verdaderas proporciones de éxitos sean $p_1, p_2$.

Hipótesis nula $H_0$: $p_1-p_2 = 0$

Hipótesis alternativa $H_a$: $p_1 - p_2 \ne 0$

En todas partes que he visto, se requiere que ambas muestras tengan al menos $10$ éxitos y fracasos. Entiendo que una distribución binomial para ser aproximada por una distribución normal necesita que se cumpla esa condición para una sola distribución.

Aquí, la hipótesis nula es que $p_1 = p_2$. Luego, la estimación de la verdadera proporción $p$ bajo esa es $\hat p = \frac{y_1 + y_2}{n_1 + n_2}$. ¿No es suficiente que el número combinado de éxitos y fracasos cumpla $y_1 + y_2 > 10$ y $n_1 + n_2 - y_1 - y_2 > 10$? Bajo la hipótesis nula, entonces, ¿eso implicaría que las muestras individuales se extraen de distribuciones aproximadamente normales si $\hat p n_1, (1 - \hat p) n_1, \hat p n_2, (1 - \hat p) n_2 > 10$? Esto implicaría luego que $\hat p_1 - \hat p_2$ está aproximadamente distribuido normalmente.

1voto

heropup Puntos 29437

La regla general de los "10 éxitos y fracasos" sólo informa si podrías usar razonablemente una aproximación normal para la estadística de prueba, o si se debería usar una estadística de prueba exacta.

Dicho esto, puedes ver inmediatamente cómo tu propuesta de modificación a la regla para considerar el número total de éxitos y fracasos en los dos grupos es inadecuada al construir un ejemplo extremo como:

$$(y_1, n_1) = (1, 2), \quad (y_2, n_2) = (9000, 10000).$$

Esto cumple fácilmente con tu criterio pero el tamaño de muestra en el primer grupo es pequeño, lo que significa que hay muy poca información que podemos inferir sobre el parámetro $p_1$.

Veamos en realidad la prueba de la hipótesis $$H_0 : p_1 = p_2 \quad \text{vs.} \quad H_a : p_1 \ne p_2. \tag{1}$$ Argumento que esto es casi equivalente a la prueba $$H_0 : p_1 = 0.9 \quad \text{vs.} \quad H_a : p_1 \ne 0.9. \tag{2}$$ Esto se debe a que la proporción observada en el grupo 2 se basa en un tamaño de muestra extremadamente grande; por lo tanto, la información contenida en los datos sobre el verdadero valor de $p_2$ es muy alta. Por ejemplo, el error estándar de $\hat p_2 = 0.9$ es $$SE(\hat p_2) = \sqrt{\frac{0.9(1-0.9)}{10000}} = 0.003.$$ Por lo tanto, el valor $p$ de la prueba para la hipótesis $(1)$ será muy cercano al valor $p$ para la hipótesis $(2)$.

Con esto en mente, es fácil calcular la probabilidad exacta de un error Tipo I para la hipótesis $(2)$:

$$\begin{align} p &= \Pr[Y_1 \le 1 \mid p_1 = 0.9] \\ &= 1 - \Pr[Y_1 = 2 \mid p_1 = 0.9] \\ &= 1 - (0.9)^2 \\ &= 0.19. \end{align}$$

Esto ciertamente no es evidencia adecuada para rechazar $H_0$. En otras palabras, si tenemos una moneda donde la probabilidad de ver cara en cualquier lanzamiento es del $90\%$, la probabilidad de ver $0$ o $1$ cara en $2$ lanzamientos es del $19\%$.

Esto nos dice que ambos grupos deben tener suficientes datos, no solo para usar una aproximación normal, sino incluso para tener la posibilidad de rechazar la hipótesis nula cuando se usa una estadística de prueba exacta. Por eso tu regla general propuesta es defectuosa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X