Digamos que tengo una encuesta con $k$ preguntas y la muestra es representativa de la población. Por tanto, si analizo los resultados de una pregunta, supongo que esos resultados son representativos de la población. Supongamos que trabajo para una empresa de alimentación. Una de las preguntas es "¿Le gusta este producto? Si los resultados fueran un 10% de respuestas afirmativas y un 90% de respuestas negativas, me parecería bien extrapolar esas cifras a la población.
Pero ahora necesito profundizar un poco. Así, entre el 90% que contestó que no le gustaba el producto, el 50% dijo que era por el envase, el 20% que era por el olor y el 30% que era por el sabor. Puede que todavía me parezca bien la extrapolación. Pero digamos que sigo desgranando una y otra vez una serie de preguntas, filtrando una y otra vez, y reduciendo progresivamente el número de respuestas en consecuencia. Así que mi pregunta es, ¿cuándo debo dejar de pensar que extrapolar los resultados a toda la población está bien? ¿Existe algún criterio matemático o algo así? Es decir, después de subdividir las respuestas $k$ veces no me sentiría muy seguro de la representatividad de los resultados, así que creo que debe haber un umbral.
Por favor, no sea tan duro conmigo, soy un principiante. Gracias.