Prueba de Chi-cuadrado. Parece que quiere ver si los resultados son consistentes con 1/4 de los sujetos en cada una de las 4 categorías. (Si se trata de verificar un dado para ver si es justo, se podría lanzarlo 600 veces para ver si obtienes cerca de 100 cuentas para cada cara).
En R, la prueba de chi-cuadrado va como se muestra a continuación. No muestra ninguna evidencia para rechazar la hipótesis nula de que las categorías son igualmente probables: Valor P muy superior a 0,05.
chisq.test(c(87,110,101,102))
Chi-squared test for given probabilities
data: c(87, 110, 101, 102)
X-squared = 2.74, df = 3, p-value = 0.4335
Notas: (a) Dado este resultado, no conviene comprobar si cada categoría individual tiene recuentos consistentes con 1/4.
(b) Si no se suministra ningún vector de probabilidad, las "probabilidades dadas se suponen iguales.
(c) Los "recuentos esperados" utilizados en esta prueba de chi-cuadrado son como sigue. En sentido estricto, no forman parte de su tabla de datos.
chisq.test(c(87,110,101,102))$exp
[1] 100 100 100 100
Prueba binomial. Si tienes dudas antes de ver los datos si la categoría A sería de las veces, podría haber hecho una prueba binomial sólo para la categoría A, como como se muestra a continuación. De nuevo, el resultado no es significativo.
binom.test(87,400, 1/4)
Exact binomial test
data: 87 and 400
number of successes = 87, number of trials = 400,
p-value = 0.1487
alternative hypothesis:
true probability of success is not equal to 0.25
95 percent confidence interval:
0.1780405 0.2611969
sample estimates:
probability of success
0.2175
Sin embargo, para ser claros, es no apropiado hacer la prueba binomial como prueba "ad hoc" a la prueba de chi-cuadrado no significativa.
La simulación como "control de la realidad". A continuación se presentan cuatro versiones simuladas de su experimento, en las que se conocido que las categorías 1 a 4 se eligen con la misma probabilidad. De esta breve simulación, parece que recuentos tan bajos como 87 en una de las cuatro categorías no son especialmente raros.
set.seed(2020)
x = sample(1:4, 400, rep=T); table(x)
x
1 2 3 4
111 83 107 99
x = sample(1:4, 400, rep=T); table(x)
x
1 2 3 4
93 109 96 102
x = sample(1:4, 400, rep=T); table(x)
x
1 2 3 4
103 117 94 86
x = sample(1:4, 400, rep=T); table(x)
x
1 2 3 4
100 101 100 99
En una simulación de 100.000 experimentos de este tipo, la categoría más pequeña fue de $\le 87$ más de una cuarta parte del tiempo.
set.seed(701)
min.ct = replicate(10^5,
min(tabulate(sample(1:4, 400, rep=T))))
mean(min.ct <= 87)
[1] 0.28186