5 votos

¿Es inválido utilizar una sola muestra para estimar más de una proporción?

Supongamos que tengo un bote de canicas blancas, negras y rojas (1000 en total) pero no sé la cantidad de cada color.

Ahora tomo una muestra de 10 canicas del tarro que contiene 3 x blancas, 4 x negras y 3 x rojas.

¿Es justo que estime la proporción de cada color y utilice el "error estándar de una proporción" para cada color de forma independiente? Por ejemplo, ¿puedo decir que hay un 30% de canicas blancas con un margen de error de $\sqrt{{p(1-p)}/{n\,}}$ y luego hacer lo mismo con el negro (40%) y el rojo (30%)?

Me siento cómodo con la fórmula del margen de error si utilizamos 3 muestras independientes de 10, con un experimento para cada color. Sin embargo, da la sensación de que estamos haciendo una "doble inmersión" y perdiendo libertad estadística en las estimaciones para el negro y el rojo si utilizamos una sola muestra, dado que si ya sabemos que 3 canicas son no negro o rojo.

Pido disculpas si utilizo una terminología incorrecta, ¡no soy estadístico!

3voto

AdamSane Puntos 1825

¿Es justo que estime la proporción de cada color y utilice el "error estándar de una proporción" para cada color de forma independiente?

Sí, absolutamente. No sólo es justo, sino también correcto.

Por ejemplo, ¿puedo decir que hay un 30% de canicas blancas con un margen de error de $\sqrt{p(1-p)/n}$ y luego hacer lo mismo con el negro (40%) y el rojo (30%)?

Piense en ello como un binomio "rojo" frente a "no rojo", por ejemplo. El error estándar de la proporción de rojo será correcto.

Sin embargo, si empiezas a hacer cálculos que implican varios colores, debes tener en cuenta su dependencia. Los recuentos de dos colores cualesquiera están correlacionados negativamente.

No es una "doble inmersión" en absoluto. Sólo estás tratando con un multinomio, y si se centra en una sola categoría frente al resto, es un binomio. Todo perfectamente legítimo.

Sin embargo, si se trata de algo parecido a mármoles En el caso de los países en vías de desarrollo, hay que tener cuidado con la cuestión del muestreo con reemplazo frente al muestreo sin reemplazo.

Tenga en cuenta que si no está realizando un muestreo con reemplazo, sus errores estándar no se aplican porque tendría una hipergeométrica, no una binomial (y la situación multicolor es una hipergeométrica multivariada en lugar de una multinomial). La varianza es menor en este caso, a veces sustancialmente menor.

Edición: sólo una nota adicional - el margen de error no suele tomarse como una desviación estándar de la proporción de la muestra.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X