9 votos

¿Qué es la estadística de prueba de Fisher ' prueba exacta de s?

Una de 2 por 2 tabla de contingencia, algunos dijeron que la prueba exacta de Fisher utiliza el recuento $X_{1,1}$ el (1,1) celda de la tabla como el estadístico de prueba, y bajo la hipótesis nula, $X_{1,1}$ tendrá una distribución hipergeométrica.

Algunos dijeron sus estadístico de prueba es $$ |X_{1,1} - \mu| $$ donde $\mu$ es la media de la distribución hipergeométrica (mencionado anteriormente) bajo nulo. Asimismo, dijo que los valores de p se determina con base en la tabla de hypergometric de distribución. Me preguntaba si hay alguna razón para restar la media y, a continuación, tomar el valor absoluto? $|X_{1,1} - \mu|$ no tiene una distribución hipergeométrica bajo nulo, no?

10voto

AdamSane Puntos 1825

(Para hacer que nuestras nociones un poco más precisos, vamos a llamar el "estadístico de prueba" la distribución de la cosa que mirar hacia arriba a la realidad calcular el p-valor. Esto significa que para una de dos colas prueba de t, nuestro estadístico de prueba serían $|T|$ en lugar de $T$.)

Lo que la prueba estadística no es la de provocar un orden en el espacio muestral (o más estrictamente, un orden parcial), de modo que usted puede identificar los casos extremos (los más consistentes con la alternativa).

En el caso de la prueba exacta de Fisher, hay ya una referencia en un sentido - que son las probabilidades de los diversos 2x2 propias tablas. Como sucede, que corresponden a los pedidos en $X_{1,1}$ en el sentido de que sea el más grande o el más pequeño de los valores de $X_{1,1}$ 'extrema' y son también los que con menor probabilidad. Así que en lugar de mirar a los valores de $X_{1,1}$ en la forma en que usted sugiere, uno puede simplemente trabajar en las grandes y pequeñas extremos, en cada paso, agregar el valor (el más grande o el más pequeño $X_{1,1}$-valor ya no existe) tiene la menor probabilidad asociada con ella, continuando hasta llegar a su observó mesa; su inclusión, el total de la probabilidad de todos los extremos de las tablas es el p-valor.

He aquí un ejemplo:

hypergeometric probability function

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

La primera columna se $X_{1,1}$ valores de la segunda columna son las probabilidades y la tercera columna es la inducida pedido.

Así, en el caso particular de la prueba exacta de Fisher, la probabilidad de cada tabla (lo que es equivalente, de cada uno de los $X_{1,1}$ valor) puede ser considerada como la prueba estadística.

Si se compara el sugerido prueba estadística de $|X_{1,1}-\mu|$, que induce en el mismo orden en este caso (y creo que lo hace en general, pero no he comprobado), en que los grandes valores de la estadística son los más pequeños los valores de la probabilidad, por lo que podría igualmente ser considerado "la estadística" - pero por lo que podría muchas otras cantidades-de hecho cualquiera que preservar este orden de los $X_{1,1}$s en todos los casos son el equivalente de la estadística de prueba, porque siempre producen idénticos p-valores.

También tenga en cuenta que con la más precisa de la noción de "prueba estadística de" introducido en el inicio, ninguno de los posibles de la estadística de prueba para este problema en realidad tiene una distribución hipergeométrica; $X_{1,1}$ lo hace, pero no es en realidad una adecuada estadística de prueba de las dos colas de la prueba (si hiciéramos una cara prueba donde sólo los más asociación en la diagonal principal y no en la segunda diagonal fue considerado como de acuerdo con la alternativa, entonces sería un estadístico de prueba). Este es el mismo de una cola/de dos colas problema que comenzó con.

6voto

JMW.APRN Puntos 21

$|X_{1,1} - \mu|$ no tienen una distribución hipergeométrica en general, porque la $\mu$ no necesita ser un valor entero y, a continuación, $|X_{1,1} - \mu|$ lo haría de no ser un número entero. Pero condicionalmente en los márgenes, $X_{1,1}$ tendrá una distribución hipergeométrica.

Si lo haces correctamente y revisión de los márgenes para los valores conocidos, se puede considerar $X_{1,1}$ (o cualquier otro celular) para su estadística. Con la analogía de dibujo $k$ bolas de una urna que contenga $W$ bolas blancas y $B$ bolas negras sin reemplazo, $X_{1,1}$ puede ser interpretado como el número de bolas blancas extraídas, donde $B$ es la suma de la primera fila, $W$ es la suma de la segunda fila, $k$ es la suma de la primera columna.

3voto

Brandon Grossutti Puntos 140

Realmente no tiene uno. Las estadísticas de prueba son una anomalía histórica - la única razón que tenemos una estadística de prueba es llegar a un valor de p. Prueba exacta de Fisher salta más allá de una estadística de prueba y va directamente a un valor de p.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X