Usted debe considerar el modelado de la situación mediante la distribución multinomial. Voy a cambiar de variables como yo prefiero reservar nn por tamaño de la muestra y denotan el número de opciones por KK (es decir, KK representa el número de colores, respuestas, etc).
Deje pkpk ser la verdadera proporción de personas en la población que elegir el kthkth elección cuando se presenta con KK opciones. Usted puede re-interpretar pkpk como la probabilidad de que una persona al azar se elige la kthkth elección cuando se presenta con KK opciones. Por lo tanto, por definición, tenemos:
K∑k=1pk=1K∑k=1pk=1
Deje xkxk soporte para el número de personas que optan por las kthkth objeto cuando nos muestra las opciones de nn de la gente. Entonces la función de densidad de xkxk está dado por la multinomial pdf:
f(x1,...xK|−)={n!x1!...xK!px11...pxKKif∑kxk=n0otherwise
Luego, puede usar al máximo la probabilidad de la teoría a la estimación de {p1,p2,...pK} y calcular los intervalos de confianza para estas estimaciones.
Cómputo de los intervalos de confianza también permiten calcular el margen de errores asociados con sus estimaciones para un determinado tamaño de muestra. Estos margen de errores le ayudará a calcular la muestra necesaria tamaños para lograr un margen de error de 5%, con un 95% de confianza.
MLE, el Margen de error y el Tamaño de la Muestra Cálculos
No es difícil mostrar que el MLE estimación de pk está dada por:
ˆpk=xkn
El de arriba estimador imparcial como:
E(ˆpk)=E(xk)n=npkn=pk
La varianza del estimador es:
V(ˆpk)=V(xk)n2=npk(1−pk)n2=pk(1−pk)n
Suponiendo que n es lo suficientemente alta, se puede utilizar el teorema del límite central para aproximar la distribución de ˆpk como una normal con la media en pk y la varianza pk(1−pk)n.
Así, el margen de error para un 95% de intervalo de confianza está dado por:
1.96√pk(1−pk)n
No sabemos pk apriori. Sin embargo, una estimación conservadora para pk que es igual a K−1 (es decir, asumimos que todas las opciones son igualmente probables). El argumento anterior es un poco ad-hoc, pero tal vez sirva el OP.
Por lo tanto, tenemos la exigencia de que:
1.96√K−1(1−K−1)n=0.05
Si dejamos K=3 obtenemos el tamaño de muestra requerido como n=341.475.
PS: La última pregunta sobre la distribución Asintótica de multinomial parece pertinente en el contexto anterior y puede sugerir maneras de prestar el rigor de las ideas anteriores.