97 votos

Dada la potencia de las computadoras en estos días, es que hay siempre una razón para hacer una prueba de chi-cuadrado en lugar de la prueba exacta de Fisher?

Dado que el software puede hacer la prueba exacta de Fisher cálculo tan fácilmente hoy en día, ¿hay alguna circunstancia en la que, en teoría o en la práctica, la prueba de chi-cuadrado es realmente preferible a la prueba exacta de Fisher?

Ventajas de la prueba exacta de Fisher incluyen:

  • escalado de las tablas de contingencia de más de 2x2 (he.e cualquier r x c de la tabla)
  • da una exacta p-valor
  • no necesidad de tener una mínima esperada recuento de células para ser válido

Gracias por las opiniones!

74voto

dan90266 Puntos 609

Usted puede poner la pregunta. Desde el ordinario de Pearson $\chi^2$ prueba es casi siempre más precisa que la prueba exacta de Fisher y es mucho más rápido para calcular, ¿por qué alguien el uso de Fisher prueba?

Tenga en cuenta que es una falacia que la espera frecuencias de células debe sobrepasar el 5 de Pearson $\chi^2$ a rendimiento exacto $P$-valores. La prueba es exacta larga de lo esperado frecuencias de células exceder de 1.0 si una muy simple $\frac{N-1}{N}$ se aplica la corrección de la prueba estadística.


De R-help, 2009:

Campbell, I. de la Chi-cuadrado y Fisher-Irwin las pruebas de dos-por-dos tablas con una pequeña muestra de las recomendaciones. La estadística en Medicina de 2007; 26:3661-3675. (resumen)

  • ...última edición de Armitage del libro se recomienda que la continuidad ajustes de nunca ser utilizado para la tabla de contingencia pruebas de chi cuadrado;

  • E. Pearson modificación de chi-cuadrado de Pearson, con la diferencia de la original por un factor de (N-1)/N;

  • Cochran señaló que el número 5 en "frecuencia esperada menor que 5" fue arbitraria;

  • los hallazgos de los estudios publicados se pueden resumir como sigue, para ensayos comparativos:

    1. Yate de la prueba de chi-cuadrado tiene error de tipo I las tasas inferiores a la nominal, a menudo menos de la mitad de la nominal;

    2. El Fisher-Irwin prueba tiene error de tipo I las tasas inferiores a la nominal;

    3. K Pearson versión de la prueba de chi-cuadrado tiene error de tipo I de las tasas más cercana a la nominal de Yate de la prueba de chi-cuadrado y Fisher-Irwin prueba, pero en algunas situaciones, da errores de tipo I apreciablemente mayor que el valor nominal;

    4. La 'N-1' prueba de chi-cuadrado, se comporta como K. Pearson 'N' versión, pero la tendencia de los mayores que los valores nominales se reduce;

    5. Las dos caras de Fisher-Irwin prueba usando Irwin regla es menos conservador que el método de duplicación de la cara de probabilidad;

    6. El mediados de-P de Fisher-Irwin prueba de la duplicación de la cara de la probabilidad se comporta mejor que las versiones estándar de la Fisher-Irwin prueba, y el mediados de-P método de Irwin regla, se realizan mejor en tener real de los errores de tipo I más cerca de los niveles nominales.";

  • un fuerte apoyo para la 'N-1' prueba frecuencias esperadas exceder de 1;

  • falla en la prueba de Fisher, que estaba basada en la de Fisher premisa de que los totales marginales no llevan ninguna información útil;

  • demostración de su información útil en muy pequeños tamaños de muestra;

  • Yate de continuidad de ajuste de N/2 es un gran exceso de corrección y es inapropiado;

  • contra-argumentos existen para el uso de la aleatorización de las pruebas de los ensayos aleatorios;

  • los cálculos de los peores de los casos;

  • recomendación general: el uso de la 'N-1' prueba de chi-cuadrado cuando todas las frecuencias esperadas son al menos 1, de lo contrario usar el de Fisher-Irwin prueba usando Irwin regla para dos caras de exámenes, la toma de las tablas desde la cola como probable, o menos, como la que se observa; véase la carta al editor por Antonio Andrés y la respuesta de los autores en 27:1791-1796; 2008.


Crans GG, Shuster JJ. Cómo conservador es la prueba exacta de Fisher? Una evaluación cuantitativa de los dos muestra comparativa binomio de prueba. La estadística en Medicina 2008; 27:3598-3611. (resumen)

  • ...primer papel realmente cuantificar el conservativeness de Fisher prueba;

  • "el tamaño de la prueba de FET fue de menos de 0,035 para casi todos los tamaños de la muestra antes de los 50 años y no se enfoque 0.05 incluso para tamaños de muestra de más de 100.";

  • conservativeness de "exacto" métodos;

  • ver Stat en Med 28:173-179, 2009, para una crítica de la que fue sin respuesta


Lydersen S, Fagerland MW, Laake P. exámenes Recomendados para la asociación en $2\times 2$ tablas. Statistics in Medicine 2009; 28:1159-1175. (resumen)

  • ...La prueba exacta de Fisher nunca debe ser usado a menos que el mediados de-$P$ se aplica la corrección;

  • valor incondicional de las pruebas;

  • véase la carta al editor de 30:890-891;2011

50voto

merriam Puntos 67

Esta es una gran pregunta.

La prueba exacta de Fisher es uno de los grandes ejemplos de Fisher, el uso inteligente de diseño experimental, junto con el condicionamiento de datos (básicamente en las tablas con el observado fila y marginales totales) y su ingenio en la búsqueda de distribuciones de probabilidad (aunque este no es el mejor ejemplo, para un mejor ejemplo ver aquí). El uso de ordenadores para calcular la "exacta" p-valores que sin duda ha ayudado a obtener respuestas precisas.

Sin embargo, es difícil de justificar las hipótesis de la prueba exacta de Fisher en la práctica. Porque el llamado "exacto" viene del hecho de que en el "té de la degustación de experiementar" o en las tablas de contingencia de 2x2 caso, el total de fila y de columna total, es decir, los marginales totales corregidos por el diseño. Esta suposición es rara vez se justifica en la práctica. Para la buena referencias ver aquí.

El nombre de "exacto", lo lleva a uno a creer que los p-valores dados por esta prueba son exactos, lo que de nuevo en la mayoría de los casos, desafortunadamente, no es correcto debido a estas razones

  1. Si los marginales no son fijados por el diseño (lo que ocurre casi todo el tiempo en la práctica), los valores de p será conservador.
  2. Puesto que la prueba se utiliza una distribución de probabilidad discreta (específicamente, Hyper-distribución geométrica), para ciertos atajos que es imposible calcular la "exacta nulo probabilidades", es decir, p-valor.

En la mayoría de los casos prácticos, utilizando una prueba de razón de verosimilitud o la prueba de Chi-cuadrado no debe dar respuestas muy distintas (p-valor) de una prueba exacta de Fisher. Sí, cuando los marginales son fijos, la prueba exacta de Fisher es una mejor opción, pero esto sucede rara vez. Por lo tanto, utilizando la prueba de Chi-cuadrado de la prueba de razón de verosimilitud siempre es recomendable para las comprobaciones de coherencia.

Ideas similares se aplican cuando el test exacto de Fisher se generaliza a cualquier tabla, que básicamente equivalente para el cálculo Multivariado Hipergeométrica proabilities. Por lo tanto, uno siempre debe tratar de calcular el Chi-cuadrado y el coeficiente de probabilidad de la distribución basada en los valores de p, además de la "exacta" p-valores.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X