13 votos

La Prueba Exacta de Fisher con pesas?

¿Alguien sabe de una variación de la Prueba Exacta de Fisher, que se lleva a pesos en la cuenta? Por ejemplo, los pesos de muestreo.
Así que en lugar de la habitual 2x2 mesa en cruz, cada punto de datos tiene una "masa" o "tamaño" valor de pesaje el punto.

Datos de ejemplo:

A B weight
N N 1
N N 3
Y N 1
Y N 2
N Y 6
N Y 7
Y Y 1
Y Y 2
Y Y 3
Y Y 4

La Prueba Exacta de Fisher, a continuación, utiliza este 2x2 cruz de la tabla:

A\B  N  Y All
 N   2  2   4
 Y   2  4   6
All  4  6  10

Si hemos de tomar el peso como un 'actual' número de puntos de datos, el resultado sería:

A\B  N  Y All
 N   4 13  17
 Y   3 10  13
All  7 23  30

Pero que el resultado sería demasiado alto de confianza. Uno de los datos de punto de cambio de N/S N/N iba a hacer una gran diferencia en la estadística.
Además, no funcionaría si cualquier peso contenido de las fracciones.

10voto

Berek Bryan Puntos 349

Tengo la sospecha de que 'exacta' pruebas y los pesos de muestreo son esencialmente incompatibles conceptos. He comprobado en Stata, que tiene buenas instalaciones para las encuestas por muestreo y razonable para el test exacto, y sus 8 posibles de la estadística de prueba para una tabla de referencias cruzadas con las ponderaciones muestrales no incluir 'exacta' pruebas como la de Fisher.

El correspondiente manual de Stata entrada (para svy: tabular twoway) aconseja el uso de su prueba predeterminada en todos los casos. Este método predeterminado se basa en la costumbre de Pearson chi-cuadrado de estadística. Citar:

"A la cuenta para el diseño de la encuesta, la estadística se convirtió en una estadística F con no entera grados de libertad mediante el uso de un segundo orden Rao y Scott (1981, 1984) corrección".

Refs:

  • Rao, J. N. K. y A. J. Scott. 1981. El análisis de datos categóricos del complejo de las encuestas de la muestra: Chi-cuadrado pruebas de bondad de ajuste e independencia en el camino de dos tablas. Revista de la Asociación Americana de Estadística 76:221-230.
  • Rao, J. N. K. y A. J. Scott. 1984. En chi-cuadrado pruebas de multiway de tablas de contingencia con células proporciones estimadas a partir de datos de la encuesta. Anales de Estadísticas 12: 46-60.

3voto

Josh Kodroff Puntos 6646

Pregunta interesante. ¿Qué se entiende por peso?

Yo estaría inclinado a hacer un bootstrap...elige tu favorito de estadística (es decir, Exacta de Fisher), y se calcula sobre los datos. A continuación, asignar nuevas células para cada instancia de acuerdo a su hipótesis nula, y repita el proceso 999 veces. Esto debe darle una muy buena distribución empírica para la prueba estadística de la hipótesis nula, y permitir el fácil cálculo de su valor-p!

2voto

patfla Puntos 1

Una cosa rápida acerca de los pesos de muestra - por lo general son una manera de incorporar alguna información acerca de la población que se está muestreando - pero que generalmente están basados en "gran ejemplo" tipo de escenarios (normalmente restringido BLUP o AZUL de predicción dentro de un disfraz). Así que me imagino que los pesos de muestra probablemente no mejor que nada de pesas. ¿Qué sería mejor, yo creo, es el uso de la información sobre la población de que el diseño de la muestra se basó en forma directa.

Por ejemplo, en lo que eran las probabilidades de selección calcula? Mi apuesta es que usted sabía una población total o de algún tipo de población ruptura que no se trata de Una o B (decir la edad, por sexo, grupos). Si esto no es correcto, a continuación, voy a perder un poco de espacio, pero si es correcto, y suponiendo que había población total $R_{1},\dots,R_{k}$ $k$ grupos (o estratos), y dentro de cada grupo tenía un "mini" de 2 en 2 tablas de contingencia. Así que ahora puede escribir $R_{1;11},R_{1;12},R_{1;21},R_{1;22},\dots$ como el "destino" de nuestra inferencia. O tal vez es la suma de $\sum_{l=1}^{k}R_{l;ij}$ que es el objetivo de la inferencia (como muchos en la población de dar respuesta N/N???). Entonces usted está tratando de razonar acerca de $R_{l;ij}$ de las muestras de los números de $r_{l;ij}$ sujeto a la restricción de que $\sum_{i,j}R_{l;ij}=R_{l}$$(l=1,\dots,k)$. (maxent a nadie?)

Tenga en cuenta que si el muestreo de probabilidades se basa sólo en lo que los datos que se reciben, entonces ellos son irrelevantes (y la prueba exacta de Fisher se aplica), porque una vez que se reciben los datos, usted sabe lo que muestra que usted recibió. Así que la cosa coherente que hacer es actualizar el muestreo de probabilidad de a $P(D_{m})=1$ si el mth unidad está en la muestra, y $P(D_{m})=0$ si no estaban en la muestra. Sin embargo, generalmente el diseño se basa en obtener más información de la que los datos pueden observar. pero tenga en cuenta que es la información, más que el diseño de la encuesta en sí que es importante. Diseño basado en la inferencia es sólo una más eficiente manera de integrar toda esa información en su análisis.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X