4 votos

Equidad de la matriz de 6 caras NO utilizando la prueba de Chi cuadrado

Así que yo estaba leyendo un montón de artículos en línea utilizando la prueba de chi-cuadrado para determinar la justicia de un dado.

Corrígeme si me equivoco, pero no los inconvenientes de utilizar una bondad de ajuste prueba es que no se puede concluir nada acerca de los distintos lados de morir, sólo si al morir fue justo o no?

No podríamos resolver este problema utilizando binomial de probabilidad similar a una determinación de la justicia de una moneda, pero en lugar de donde utilizamos un uno contra todos? Sé que lo que escribo a continuación es una especie de tonto y sin sentido; sólo estoy tratando de ver si realmente entiendo el problema.

Así que en lugar de una prueba de Chi-Cuadrado, se puede hacer de 6 pruebas y ejecución de una prueba de hipótesis para cada una distribución binomial. Vamos a rodar a 100 veces para cada lado (total de 600 veces):

Por un lado = 1:

$P(1) \approx .1666$

$P(2,3,4,5,6) \approx .8333$

$\mu = np = 100*.1666$

$\sigma^2 = npq = 100*.1666*.8333$

$...$

Por un lado = 6:

$P(6) = .166$

$P(1,2,3,4,5) = .833$

$\mu = np = 100*.1666$

$\sigma^2 = npq = 100*.1666*.8333$

Si cualquiera de los lados caen fuera de la región crítica, rechazamos la hipótesis nula, y se puede determinar qué lado de la(s) más probable es sesgada.

Par de preguntas:

  • Este método es válido?
  • Sería este resultado nos da un resultado similar a una prueba de chi-cuadrado?
  • Tenemos que hacer las correcciones debido a las múltiples comparaciones problema?

5voto

Stat_Programmer Puntos 56

Voy a hablar un poco más en general/sentido intuitivo puesto que hay ya gran estadística de los recursos que hay para esto. Un ejemplo sería el de aquí.

La prueba de Chi-cuadrado de por sí (el estadístico de prueba, p-valor, conclusión) no nos dice acerca de los distintos lados de la die.

Sin embargo, se puede ver en los residuos (diferencia entre observaron recuentos vs espera cuentas) para tener una idea acerca de los distintos lados de la die. Incluso mejor, usted puede utilizar una versión estandarizada de los residuos se llama la prueba de Pearson de los residuos. $$ r_{i} = \frac{O_{i}-E{i}}{\sqrt{E_{i}}} $$ para $i = 1$,...,$6$ lados de morir.

Si $r_{i}$ es negativo, entonces no eran menos observaciones de lado $i$ de lo que cabría esperar bajo la hipótesis nula (de morir que sea justo), y si $r_{i}$ es positivo, no eran más observaciones de lo esperado en el valor null.

Grande (absoluta) de los valores de $r_{i}$ proporcionan más evidencia contra la hipótesis nula, y de hecho todos los de la $r_{i}$ juntos contribuir a su final estadístico de chi-cuadrado: $$ \chi^{2} = \sum_{i=1}^{6} r_{i}^{2} $$

Usted puede realizar las pruebas de significación de la $r_{i}$ separado. Esto correspondería directamente a su técnica de pruebas de las probabilidades individuales de cada uno de los lados del dado por separado. Pero entonces uno se pregunta lo que usted está tratando de responder. Está usted interesado en el conjunto de morir, o sólo en un lado? Que habrían de determinar si el método es válido.

Si usted está interesado sólo en un lado, no es necesario comprobar los otros lados. Sólo la prueba de que por un lado e ignorar las pruebas individuales y de la general de la prueba de chi-cuadrado.

Si tu estás interesado en el conjunto de morir, entonces el método de la revisión de cada lado individualmente va a distorsionar el Tipo 1 de la tasa de error en comparación con la prueba de chi-cuadrado. Para obtener un sentido intuitivo por qué, considere la fórmula anterior:
$$ \chi^{2} = \sum_{i=1}^{6} r_{i}^{2} $$

La prueba de chi-cuadrado considera todos los residuos juntos. Bajo el null, algunos serán más grandes, y algunos serán más pequeños, pero la prueba de chi-cuadrado, en efecto, la media (en un sentido amplio del término), todos sus respectivos valores. Pero las pruebas individuales se concentran en los residuos con mayor (estandarizado) valores. En general, esto haría que sus pruebas individuales técnica superior de Tipo 1 las tasas de error de la prueba de chi-cuadrado.

Usted podría hacer comparaciones múltiples para protegerse contra este Tipo 1 de la tasa de error. Basado en sus pruebas individuales idea, usted quiere protegerse contra la familia de sabios de la tasa de error, por lo que una adecuada comparación múltiple técnica sería la Bonferonni corrección.

4voto

Sal Mangiafico Puntos 26

Me pregunto si el uso de intervalos de confianza para multinomial proporciones podría ser una buena aproximación. Si el intervalo de confianza para un lado no incluyen la proporción esperada de 1/6, que sería la evidencia de que sería indicador de que algo está mal con ese lado.

No sé si hay múltiples pruebas problema con este enfoque.

A continuación tienes algunos R código, con datos hipotéticos. Después de 100 funciones, Lado 3 tiene un sospechosamente alta proporción. Los intervalos de confianza para la multinomial proporciones se generan con el Sisón y Terr método. Estos también son fáciles de visualizar en una parcela; de aquí la línea horizontal indica el esperado 0.167 proporción. También se incluye un chi-cuadrado de bondad de ajuste de prueba y estandarizada de los residuos.

La instalación de los paquetes

if(!require(DescTools)){install.packages("DescTools")}
if(!require(ggplot2)){install.packages("ggplot2")}

Datos hipotéticos

Side = c(1,2,3,4,5,6)
Counts = c(15, 15, 26, 14, 16, 14)

sum(Counts)

    ### [1] 100

Sisón y Terr intervalos de confianza

library(DescTools)

MCI = MultinomCI(Counts)

MCI

   ###       est lwr.ci    upr.ci
   ### [1,] 0.15   0.06 0.2480369
   ### [2,] 0.15   0.06 0.2480369
   ### [3,] 0.26   0.17 0.3580369
   ### [4,] 0.14   0.05 0.2380369
   ### [5,] 0.16   0.07 0.2580369
   ### [6,] 0.14   0.05 0.2380369

   ### Here, est is the proportion for that side, 
   ### and lwr.ci and upr.ci indicate the confidence interval for that side.

Crear la trama

library(ggplot2)

Data = as.data.frame(MCI)

Data$Side = factor(Side)

Data

enter image description here

Curiosamente, un chi cuadrado de bondad de ajuste prueba no indica que la cuenta se desvían de los valores esperados. Yo también corrió una prueba exacta (no se muestra), y el p-valor no fue de 0.22.

$Proportion = Data$

Pero un estándar residual > 2 sugiere algo que es muy interesante, con la cara 3.

est

qplot(x = Side, y = Proportion, data = Data) +

geom_errorbar(aes(ymin = lwr.ci, ymax = upr.ci, width = 0.15)) + 

geom_hline(aes(yintercept=0.1667))

Referencias: Bondad de Ajuste de las Pruebas para las Variables Nominales. Advertencia: yo soy el autor de esta página web.

3voto

Aaron Puntos 36

Como usted ha percibido correctamente en su pregunta, el principal problema con el método que se propone es que se trata de múltiples pruebas de hipótesis para controlar una sola hipótesis subyacente, y por lo tanto sufre el problema de las comparaciones múltiples. Como tu pregunta es actualmente enmarcado, usted está preguntando si su método es una prueba válida, y si necesita ser ajustado para comparaciones múltiples. Sin embargo, en el momento en que en realidad no tiene "una prueba", tiene seis pruebas. Si desea combinar en una sola prueba de que es estadísticamente sonido, entonces sí, usted tendrá que ajustar para comparaciones múltiples.

Por el momento no ha propuesto un método para combinar estas seis pruebas individuales en un único general de la prueba, así como está, aún no ha especificado el método de prueba. Sin embargo, si se va a proceder a formar un marco de prueba de hipótesis que combina estas pruebas individuales, tendría que combinar el individuo los valores p de las pruebas en un único general p-valor, con un adecuado ajuste para comparaciones múltiples. Esto equivaldría a la formación de una única prueba en la que el estadístico de prueba es una función de la cuenta de resultados. Puesto que esto es ya lo que se hace en un estándar multinomial de la prueba, es probable que cualquier intento de ajustar el método a ser estadísticamente sonido llevaría a un método que es similar a (o inferior) con un estándar de prueba.

Si a usted le gustaría seguir esta propuesta con más detalle, me gustaría sugerir algunos preliminar de lectura existentes multinomial pruebas utilizadas en el análisis de datos categóricos. He fijado una visión básica del problema a continuación, pero yo le recomiendo consultar algunos libros sobre este para aprender acerca de las pruebas existentes. Si usted siente que usted podría desarrollar una competencia de prueba a través de su método, sería necesario especificar completamente el método de agregar las pruebas individuales, y a continuación se derivan de los estadísticos resultantes de las propiedades de la prueba, y compararlo con los métodos existentes.


Pruebas de equidad de morir: En el caso general donde sacas un $m$colindado mueren $n$ veces, usted va a obtener cara cuenta que se distribuyen según una distribución multinomial:

$$\mathbf{N} \sim \text{Multinomial}(n, \mathbf{p}),$$

donde $\mathbf{p}=(p_1,...,p_m)$ es el vector de probabilidades de los resultados sobre el morir. El morir es justo, si la probabilidad de vector es el uniforme de vectores $\mathbf{u} = (\tfrac{1}{m},...,\tfrac{1}{m})$. Hay un número de multinomial pruebas de que puede ser utilizado para probar la hipótesis:

$$H_0: \mathbf{p} = \mathbf{u} \quad \quad \quad H_0: \mathbf{p} \neq \mathbf{u}.$$

Algunos de los disponibles multinomial pruebas de uso de la distribución chi-squared como una aproximación de la distribución muestral del estadístico de prueba. Si el conjunto de datos no es demasiado grande, a veces es posible evitar el chi-cuadrado de cálculo en favor de una prueba exacta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X