Tengo la sensación de dos preguntas. Uno sobre el tamaño de la muestra (25%, ¿por qué no la mayoría) y otro acerca de la técnica de muestreo (es realmente aleatorio, muestreo de 25% al azar en el conjunto de la sociedad, muestra de 25% al azar en cada departamento, o utilizar algún otro tipo de distribución).
1) el tamaño de La muestra no necesita ser una mayoría. El tamaño de muestra requerido puede ser cualquier cosa entre 0 y 100%, dependiendo de la precisión requerida para un determinado confianza o de la razón de verosimilitud.
100% de certeza nunca es obtenido (también con un 50% o mayor subconjunto). Alcanzar una alta precisión no es también el punto de muestreo y la estimación.
Ver más sobre tamaños de muestra: https://en.wikipedia.org/wiki/Sample_size_determination
Si usted obtiene la ley de los grandes números a los que usted también puede tener una idea intuitiva.
La distribución de los promedios de todos los posibles subconjuntos (y su ejemplo será uno de ellos), se hacen más pequeños, y más cerca de la media de la distribución original, si el tamaño del subconjunto aumenta. Si selecciona una persona, a continuación, hay alguna posibilidad razonable de que usted encontrar una excepción, pero para encontrar la misma excepción en la misma dirección dos veces se vuelve menos probable. Y así sucesivamente, el más grande es el tamaño de la muestra subconjunto menor será la posibilidad de una excepcional subconjunto.
Finalmente, la distribución de los promedios de todos los posibles subconjuntos tiene una varianza igual a la varianza de la serie original dividido por $n$ el tamaño del subconjunto.
Nota importante! Su presupuesto no va a ser dependiente del tamaño de la población de la que se muestra, pero en la distribución de esa población.
En el caso de los 500 tamaño del departamento. La desviación de las medias de azar subconjuntos (de tamaño 125) será de 11 veces más pequeño que el original de la desviación. Tenga en cuenta que el error en la medición (la desviación de la media de los subconjuntos seleccionados al azar), es independiente del tamaño del departamento. Podría ser de 500, 5000, o 50000, en todos los casos, la estimación sería afectado siempre que tengan la misma distribución (ahora un pequeño departamento podría tener alguna extraña distribución, pero que comienza a desaparecer para grupos más grandes).
2) La toma de muestras no necesitan ser totalmente al azar. Usted puede tomar la demografía en cuenta.
Finalmente, usted podría tratar a cada departamento por separado en este tipo de análisis y corregir las variaciones entre los departamentos y cómo se han tomado muestras en estos, de diferente tamaño, departamentos.
En esta corrección hay dos importantes diferencias. Uno podría suponer que la distribución entre los grupos de una variable aleatoria o no. Si te tratan como una variable aleatoria, a continuación, el análisis se vuelve más fuerte (algunos grados de libertad en el modelo), pero podría ser un supuesto erróneo de que si los diferentes grupos no son intercambiables como al azar entidades sin efecto específico (que parece ser tu caso, ya que me imagino que los departamentos tienen diferentes funciones y pueden tener muy diferentes sentimiento que no es al azar, en relación con el departamento).