4 votos

Suma de la distribución normal truncada.

Necesito estimar cuál es la probabilidad de que la suma de la altura de 3 mujeres + 7 hombres sea mayor que 17 m considerando que los hombres siguen una distribución normal [mu = 1.8 sd = 0.10] y mujeres [mu = 1.6 sd = 0.08], con Una captura: He seleccionado previamente solo a hombres con una altura inferior a 1,9 my mujeres con una altura inferior a 1,75 m. Alguna idea de cómo proceder?

Gracias

4voto

farzad Puntos 4180

Deje $Z\sim \mathrm{N}(\mu,\sigma^2)$. Decimos que $U$ tiene una distribución normal truncada $\mathrm{TN}(\mu,\sigma^2,(a,b))$ fib $$ P(U\B) = P(Z\in B\mediados de los a<Z<b) \, , $$ para cada conjunto de Borel $B$. Es fácil probar que $$ \mathrm{E}[U] = \mu + \frac{\phi(\alpha)-\phi(\beta)}{\Phi(\beta)-\Phi(\alpha)} \sigma \, , $$ donde $\alpha=(a-\mu)/\sigma$, $\beta=(b-\mu)/\sigma$, $\phi(t)=e^{-t^2/2}/\sqrt{2\pi}$, y $\Phi$ es la función de distribución de una $\mathrm{N}(0,1)$ variable aleatoria.

En su problema, usted tiene $$ W_i=\mathrm{TN}(1.6,(0.08)^2,(0,1.75)) \, , $$ para $i=1,2,3$, y $$ M_i=\mathrm{TN}(1.8,(0.10)^2,(0,1.9)) \, , $$ para $i=1,\dots,7$.

El siguiente Teorema es debido a la gran Wassily Hoeffding.

Teorema. Si $X_1,\dots,X_n$ son independientes de variables aleatorias tales que $\mathrm{E}[X_i]=0$$a_i<X_i<b_i$$i=1,\dots,n$, luego $$ P\left(\sum_{i=1}^n X_i\geq \epsilon\right) \leq e^{-t\epsilon}\prod_{i=1}^n e^{t^2(b_i-a_i)^2/8} $$ para cada $\epsilon>0$ y cada una de las $t>0$.

Ahora, definir $X_i=W_i-\mathrm{E}[W_i]$$i=1,2,3$, y definir $X_{j+3}=M_j-\mathrm{E}[M_j]$$j=1,\dots,7$. Tenga en cuenta que $\mathrm{E}[X_i]=0$.

Ahora los límites. Por ejemplo, desde $$0<W_i<1.75\, ,$$ you have $$-\mathrm{E}[W_i]<X_i<1.75-\mathrm{E}[W_i]\, ,$$ for $i=1,2,3$. Do the same for the men, and you will find all the $a_i$'s and $b_i$s'.

El uso de Hoeffding la desigualdad anterior, se puede encontrar, para cada una de las $t>0$, un límite superior (su presupuesto) para la probabilidad de $$ P\left( \sum_{i=1}^3 W_i + \sum_{i=1}^7 M_i \geq 17 \right) = P\left( \sum_{i=1}^{10} X_i \geq 17 -3\mathrm{E}[W_1]-7\mathrm{E}[M_1]\right) \, . $$

Ahora, ¿cuál es el valor de $t$ que te da la más ajustada límite superior?

Por favor, plug-in en los números y publicar la respuesta como un comentario.

3voto

keithosu Puntos 156

Este es un enfoque rápido basado en simulación al que se refieren vinux y Glen b.

 start <- Sys.time()
library("msm")
library("xts")
nsim <- 1000000
men <- rtnorm(7*nsim,mean=1.8,sd=0.1,upper=1.9)
women <- rtnorm(3*nsim,mean=1.6,sd=0.08,upper=1.75)
sums <- as.numeric(period.sum(men,seq(0,length(men),by=7)))+as.numeric(period.sum(women,seq(0,length(women),by=3)))
prob <- sum(sums>17)/nsim
prob
end <- Sys.time()
end-start
 

La probabilidad es aproximadamente del 77.2% basada en una simulación de 7M hombres y 3M mujeres. Esto se ejecuta en unos 6,4 segundos en mi computadora.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X