Soy bastante nuevo a la estadística (un puñado de principiante de nivel Uni cursos) y me estaba preguntando acerca de muestreo de desconocido distribuciones. Específicamente, si usted no tiene ninguna idea acerca de la distribución subyacente, ¿hay alguna manera de "garantizar" que usted obtenga una muestra representativa?
Ejemplo para ilustrar: digamos que usted está tratando de averiguar la distribución mundial de la riqueza. Para cualquier individuo dado, de alguna manera se puede averiguar su exacta de la riqueza; pero no se puede "probar" cada persona en la Tierra. Así que, digamos que usted muestra n = 1000 personas al azar.
Si la muestra no incluye a Bill Gates, se podría pensar que no hay multimillonarios en existencia.
Si la muestra incluía a Bill Gates, se podría pensar que los multimillonarios son más comunes de lo que realmente son.
En cualquier caso, usted realmente no puede decir cómo comunes o raros millonarios son; usted no puede ser capaz de decir si existe en absoluto.
Hace un mejor mecanismo de toma de muestras existen para un caso como este?
¿Cómo le digo a priori qué procedimiento de muestreo a utilizar (y cuántas muestras son necesarios)?
A mí me parece que usted podría tener que "muestra" un gran porcentaje de la población, a saber, con nada que se aproxime a la certeza razonable, cómo comunes o raros multimillonarios que están en el planeta, y que esto es debido a que la distribución subyacente ser un poco difícil trabajar con ellos.