1 votos

¿Cómo se determina la importancia de las desviaciones individuales en las categorías?

Tengo observaciones de observadores humanos que pretendían colocar a los sujetos en una de las cuatro categorías (A-D). De hecho, hay 100 sujetos en cada categoría. Así que en un mundo ideal debería haber "100" en cada categoría.

            |  A  |  B  |  C  |  D
Observation | 87  | 110 | 101 | 102
'Ideal'     | 100 | 100 | 100 | 100

Si quisiera saber si el conjunto de las observaciones difiere de forma estadísticamente significativa del caso ideal, haría una prueba de Chi-Cuadrado.

Pero, ¿qué prueba puede decirme si las observaciones de una categoría concreta difieren significativamente? Por ejemplo, ¿es el valor "87" (categoría A) significativamente diferente?

1voto

manku Puntos 111

Prueba de Chi-cuadrado. Parece que quiere ver si los resultados son consistentes con 1/4 de los sujetos en cada una de las 4 categorías. (Si se trata de verificar un dado para ver si es justo, se podría lanzarlo 600 veces para ver si obtienes cerca de 100 cuentas para cada cara).

En R, la prueba de chi-cuadrado va como se muestra a continuación. No muestra ninguna evidencia para rechazar la hipótesis nula de que las categorías son igualmente probables: Valor P muy superior a 0,05.

chisq.test(c(87,110,101,102))

        Chi-squared test for given probabilities

data:  c(87, 110, 101, 102)
X-squared = 2.74, df = 3, p-value = 0.4335

Notas: (a) Dado este resultado, no conviene comprobar si cada categoría individual tiene recuentos consistentes con 1/4.

(b) Si no se suministra ningún vector de probabilidad, las "probabilidades dadas se suponen iguales.

(c) Los "recuentos esperados" utilizados en esta prueba de chi-cuadrado son como sigue. En sentido estricto, no forman parte de su tabla de datos.

chisq.test(c(87,110,101,102))$exp
[1] 100 100 100 100

Prueba binomial. Si tienes dudas antes de ver los datos si la categoría A sería de las veces, podría haber hecho una prueba binomial sólo para la categoría A, como como se muestra a continuación. De nuevo, el resultado no es significativo.

binom.test(87,400, 1/4)

        Exact binomial test

data:  87 and 400
number of successes = 87, number of trials = 400, 
  p-value = 0.1487
alternative hypothesis: 
  true probability of success is not equal to 0.25
95 percent confidence interval:
 0.1780405 0.2611969
sample estimates:
probability of success 
                0.2175 

Sin embargo, para ser claros, es no apropiado hacer la prueba binomial como prueba "ad hoc" a la prueba de chi-cuadrado no significativa.

La simulación como "control de la realidad". A continuación se presentan cuatro versiones simuladas de su experimento, en las que se conocido que las categorías 1 a 4 se eligen con la misma probabilidad. De esta breve simulación, parece que recuentos tan bajos como 87 en una de las cuatro categorías no son especialmente raros.

set.seed(2020)
x = sample(1:4, 400, rep=T); table(x)
x
  1   2   3   4 
111  83 107  99 
x = sample(1:4, 400, rep=T); table(x)
x
  1   2   3   4 
 93 109  96 102 
x = sample(1:4, 400, rep=T); table(x)
x
  1   2   3   4 
103 117  94  86 
x = sample(1:4, 400, rep=T); table(x)
x
  1   2   3   4 
100 101 100  99 

En una simulación de 100.000 experimentos de este tipo, la categoría más pequeña fue de $\le 87$ más de una cuarta parte del tiempo.

set.seed(701)
min.ct = replicate(10^5, 
                   min(tabulate(sample(1:4, 400, rep=T))))
mean(min.ct <= 87)
[1] 0.28186

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X