Hicimos un muestreo por cuotas en función del grupo de edad, el sexo y el nivel educativo. Dado que preguntamos a desconocidos en la calle, sólo pudimos evaluar el nivel educativo después de hablar con la gente. Dada la brevedad del cuestionario, formulamos las preguntas de todos modos.
Ahora tenemos unos 500 cuestionarios rellenados, pero sólo podemos cumplir la cuota con unos 250 de ellos. Si utilizáramos a todos los participantes, los académicos estarían sobremuestreados (ciudades universitarias), mientras que los no académicos estarían submuestreados (tanto hombres como mujeres, más severamente para las mujeres). Para analizar los datos con 250 casos, tomamos a todos los de las combinaciones límite. Pero, ¿qué hacemos con las demás combinaciones que están sobremuestreadas?
- ¿Simplemente hacer un sorteo aleatorio en estas combinaciones sobremuestreadas (para que el número de casos coincida con la cuota de esa combinación, por ejemplo, tenemos demasiados académicos en algunos grupos de edad entre los que podemos hacer un sorteo aleatorio)?
- ¿Extraer repetidamente las combinaciones sobremuestreadas y promediar los resultados?
- Depende, dependiendo de...
- ¿De alguna otra manera?
No estoy seguro de cómo proceder aquí.
Editar: Se me olvidó mencionar que buscamos una muestra representativa (utilizando distribuciones de la edad, el sexo y el nivel educativo de la población para determinar las cuotas).