70 votos

¿Cuál es la relación entre un chi cuadrado y la prueba de igualdad de proporciones?

Supongamos que tengo tres poblaciones con cuatro, mutuamente exclusivas características. Puedo tomar muestras al azar de cada población y la construcción de una tabla de referencias cruzadas o tabla de frecuencias de las características que yo soy de medición. Estoy en lo correcto en decir que:

  1. Si quería poner a prueba si existe alguna relación entre las poblaciones y de las características (por ejemplo, si una población tiene una mayor frecuencia de una de las características), que debo ejecutar una prueba de chi-cuadrado y ver si el resultado es significativo.

  2. Si la prueba de chi-cuadrado es significativo, sólo me muestra que existe una cierta relación entre las poblaciones y características, pero no cómo están relacionados.

  3. Además, no todas las características que necesita estar relacionado con la población. Por ejemplo, si las diferentes poblaciones tienen diferentes distribuciones de las características a y B, pero no de C y D, entonces la prueba de chi-cuadrado todavía puede volver como significativo.

  4. Si quería medir si o no de una determinada característica se ve afectado por la población, a continuación, puede ejecutar una prueba de igualdad de proporciones (yo he visto a este llamado de la prueba z, o como prop.test() en R) en sólo ese carácter.

En otras palabras, es apropiado para el uso de la prop.test() para determinar con más precisión la naturaleza de de una relación entre dos conjuntos de categorías en el momento de la prueba de chi-cuadrado dice que existe una relación significativa?

38voto

Iain Holder Puntos 7930

Una prueba de chi-cuadrado para la igualdad de dos proporciones es exactamente lo mismo que $z$-prueba. La distribución chi-squared con un grado de libertad es sólo la de una normal desviarse, al cuadrado. Básicamente lo que hace es sólo la repetición de la prueba de chi-cuadrado en un subconjunto de la tabla de contingencia. (Esta es la razón por la @chl obtiene exactamente el mismo $p$-valor con ambas pruebas.)

El problema de hacer la prueba de chi-cuadrado nivel mundial primero y, a continuación, buceando a hacer más pruebas en los subconjuntos es que no necesariamente preservar su alfa -- que es, no el control de los falsos positivos en menos del 5% (o lo que sea $\alpha$) en todo el experimento.

Creo que si quieres hacer esto correctamente en el paradigma clásico, usted necesita identificar su hipótesis en el principio (en las proporciones para comparar), la recogida de los datos y, a continuación, probar la hipótesis de tal manera que el total umbral de importancia de cada prueba de que las sumas de $\alpha$. A menos que pueda demostrar a priori que existe cierta correlación.

El más poderoso de prueba para la igualdad de proporciones se llama la estrella de Barnard en la prueba de la superioridad.

33voto

DavLink Puntos 101

Muy breve respuesta:

La prueba de chi-Cuadrado (chisq.test() R) compara las frecuencias observadas en cada categoría de una tabla de contingencia con las frecuencias esperadas (calculada como el producto de las frecuencias marginales). Se utiliza para determinar si las desviaciones entre lo observado y el esperado recuentos son demasiado grandes para ser atribuido a la casualidad. Salida desde la independencia es fácilmente controlado por la inspección de los residuos (intente ?mosaicplot o ?assocplot, sino también a la vcd paquete). Uso fisher.test() para una prueba exacta (confiando en la distribución hipergeométrica).

El prop.test() función en R que permite comprobar si las proporciones son comparables entre los grupos o no se diferencian de probabilidades teóricas. Se refiere a un $z$-prueba ya que la estadística de prueba se parece a esto:

$$ z=\frac{(f_1-f_2)}{\sqrt{\hat p\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}} $$

donde $\hat p=(p_1+p_2)/(n_1+n_2)$, y los índices de dólares(1,2)$ refieren a la primera y segunda línea de la tabla. En un camino de tablas de contingencia donde $H_0:\; p_1=p_2$, este debe producir resultados comparables a la ordinaria $\chi^2$ de prueba:

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

Para el análisis de datos discretos con R, recomiendo R (y S-PLUS) Manual para Acompañar a Agresti del Análisis de Datos Categóricos (2002), de Laura Thompson.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X