12 votos

¿Hay alguna referencia que legitime el uso de la prueba z no agrupada para comparar dos proporciones?

La prueba z para comparar dos proporciones es$\newcommand{\p}{\hat{p}}\newcommand{\v}{\mathrm{Var}} z=\frac{\p_1-\p_2}{\sqrt{\v(\p_1-\p_2)}}$. Por lo general se define que

PS

dónde

PS

¿Hay alguna referencia escrita que me legitime a usar la varianza no agrupada, es decir?

PS

14voto

jldugger Puntos 7490

El unpooled varianza tiende a ser demasiado pequeño. Esto es debido a que bajo la hipótesis nula todavía habrá posibilidad de variación en los dos proporciones observadas, aunque el subyacente probabilidades son iguales. Esta posibilidad de variación contribuye a que el conjunto de la varianza, pero no a la unpooled de la varianza.

Como resultado, $z$ para el unpooled estadística no tiene aproximadamente una distribución normal estándar. Por ejemplo, cuando se $n_1 = n_2$ y el verdadero probabilidades son tanto $1/2$, la varianza de las $z$ solo $1/2$ en lugar de $1$. Mediante el uso de tablas de la distribución normal estándar, usted recibirá incorrecta de los valores de p: tienden a ser artificialmente pequeño, demasiado a menudo rechazar la nula cuando la evidencia no es realmente allí.

Sin embargo, uno se pregunta si esto podría ser corregido. Se puede. La pregunta se convierte en si una corregido valor de $z$, basado en unpooled estimaciones, podría haber una mayor potencia para detectar desviaciones de la hipótesis nula. Unos pocos simulaciones sugieren que este no es el caso: el conjunto de prueba (en comparación con un ajustado correctamente unpooled prueba) tiene una mejor oportunidad de rechazar la nula cuando la nula es falsa. Por lo tanto, yo no he molestado a trabajar fuera de la fórmula para el unpooled corrección; parece inútil.

En resumen, la unpooled prueba está mal, pero con una corrección adecuada, puede ser legítimo. Sin embargo, parece ser inferior a la que el conjunto de prueba.

9voto

Bryan Rehbein Puntos 3947

Hay un poco de discusión sobre este en el AP sitio.

Usted puede usar cualquier estadística que desea, a condición de que usted está claro sobre qué hacer y mirar el apropiado nula de distribución para calcular los valores de p o umbrales.

Pero algunas estadísticas son mejores que otros; en este caso se estaría buscando (a) nula distribución calcula fácilmente y (b) la potencia para detectar la diferencia.

Pero no sé por qué te gustaría a favor de la unpooled de la varianza sobre el conjunto de la varianza para la prueba, a pesar de que podría ser preferido en el cálculo de un intervalo de confianza para la diferencia.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X