3 votos

Asignación óptima

Se va a encuestar a una población universitaria de tamaño N=9000 mediante un muestreo estratificado para determinar la prevalencia de una determinada enfermedad basándose en tres estratos de tamaños respectivos $N_h$ = 1000, 3000 y 5000 para h = 1, 2, 3. Los costes del muestreo de individuos de estos estratos se estiman en 40, 20 y 10 dólares por persona, respectivamente. Las autoridades sanitarias del campus creen que aproximadamente el 1% del estrato 1, el 5% del estrato 2 y el 12% del estrato 3 darán positivo a la enfermedad.

¿Cuál es el número óptimo de individuos a muestrear en cada estrato si el presupuesto total para la recogida de datos en la encuesta es de 2000 $?

$n_1$ = c* $\frac{(N_1*S_1)/\sqrt{c_1}}{\Sigma (N_h*S_h)/\sqrt{c_h}}$

$n_1$ = 2000* $\frac{(1000*\sqrt{.0099})/\sqrt{40}}{(1000*\sqrt{.0099})/\sqrt{40}+(3000*\sqrt{.0475})/\sqrt{20}+(5000*\sqrt{.1056})/\sqrt{10}}$ = 46.562449

La respuesta correcta es 3,620154, así que me gustaría saber en qué me he equivocado.

4voto

Mike Barrett Puntos 57

Modificado 2014-07-22 : Su fórmula para $n_h$ es incorrecto; los valores están en las proporciones correctas, pero, como ha señalado Dennis, has aplicado las proporciones al coste total. La fórmula sería correcta si hubieras sustituido el tamaño de la muestra por $n$ para $c$ pero, por supuesto, eso no se puede saber de antemano.

He aquí la solución presentada por Cochran, 1977, pp 97-98, que deriva la fórmula 1:

$$ \frac{n_h}{n} = \frac{N_h S_h /\sqrt{c_h}}{\sum_h (N_h S_h/\sqrt{c_h})} \quad \quad (1) $$

(Cochran, 1977, p. 98, Ec. 5.23)

para que

$$ n_h = n \frac{N_h S_h /\sqrt{c_h}}{\sum_h (N_h S_h/\sqrt{c_h})} \quad \quad $$

Aún no sabemos qué $n$ así que sustituye el $n_h$ anterior en la ecuación de costes:

\begin{equation} c = \sum_{h} c_h n_h \end{equation} (Cochran, p. 97, Ec. 5.17)

para obtener (Corregido 2014-07-22): $$ n = c \times \frac{\sum_h (N_h S_h /\sqrt{c_h})}{\sum_h (N_h S_h \sqrt{c_h})} $$ (Cochran, p. 98, Ec. 5.24)

Tenga en cuenta que $c$ es el variable coste. Un total real incluiría un coste fijo.

Ahora multiplica la Ec. 1 por $n$ para obtener el $n_h$ .

Una solución mucho más sencilla

Si crees que esto es demasiado complicado, estoy de acuerdo. Aquí tienes un método más sencillo. La clave de la simplificación es darse cuenta, a partir de la ecuación 1, de que

\begin{equation} n_h \propto {N_h S_h /\sqrt{c_h}} \quad \quad (2) \end{equation}

En otras palabras, el $n_h$ son proporcional en el lado derecho de la ecuación 2.

Creamos conjeturas preliminares para la $n_h$ Llámalos $n_h'$ que también son proporcionales al lado derecho de la ecuación 2. A continuación, hallamos el coste total $c'$ para la $n_h'$ en comparación con el coste objetivo $c$ (= 2.000 $) y corregir por su cociente.

La asignación más sencilla para $n_h'$ es el lado derecho de la ecuación 2:

\begin{equation} n_h' = {N_h S_h /\sqrt{c_h}} \end{equation}

Estos son: $n_1' = 15.732$ , $n_2' = 146.202$ y $n_3' = 518.809$ . Aplicación de los costes $c_1 = 40$ , $c_2 = 20$ y $c_3 = 10$ a éstos dan el coste total preliminar:

$$ c' = \$ 8,691.417 $$

Esto es demasiado alto, comparado con $c = \$ 2,000 $, so the $ n_h' $ are too big. To get the final values of the $ n_h $, deflate the preliminary values by $ c/c' = 0,230112 $. Multiplying each by $ c/c' $ yields $ n_1 = 3.620 $; $ n_2 = 33.643 $; and $ n_3 = 118.233 $. Rounding to the nearest whole number yields a total cost of \$ 2.020, todavía demasiado alto, así que redondea $n_2$ abajo para obtener los valores finales de $n_1 =4$ , $n_2 = 33$ y $n_3 = 118$ . Una comprobación muestra que el coste final es de 2.000 $, tal y como se requiere.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X