5 votos

Cálculo de la probabilidad de la distribución logarítmica normal con suelo

Quiero extraer mediante programación una muestra aleatoria discreta de una distribución log-normal. Para ello, calculo un $x$ -valor de una fuente aleatoria uniforme, por ejemplo, algún generador de números pseudoaleatorios. Esto lo utilizo como entrada para el log-normal $PDF$ para una variable aleatoria $X \sim \ln\mathcal{N}(\mu, \sigma)$ con algunos parámetros $\mu$ y $\sigma$ . Para obtener valores discretos a partir de esto redondeo el resultado hacia abajo, por lo tanto tendría una nueva variable aleatoria: $Y \sim \lfloor \ln\mathcal{N}(x;\mu,\sigma)\rfloor$

Mi pregunta ahora es, ¿cómo calcular la probabilidad de que un resultado observado $y_0$ procedían de esta distribución. Mi intento es el siguiente:

A mi entender la función suelo del valor tiene el efecto de igualar las probabilidades en un intervalo abierto $[y, y+1)$ por lo que la probabilidad podría calcularse como $P(Y=y_0) = P(y_0 \le X < y_0+1) = P(X < y_0+1) - P(X < y_0)$ .

Como la distribución log-normal es continua, $\forall y: P(X=y) = 0$ . Por lo tanto $P(X < y_0+1) - P(X < y_0) = P(X \leq y_0+1) - P(X \leq y_0)$ . Por tanto, la probabilidad de que el valor observado proceda de la variable floor'ed $Y$ podría calcularse como

$P(Y=y_0) = P(X \leq y_0 + 1) - P(X \leq y_0)$ .

Esto podría hacerse fácilmente utilizando la log-normal $CDF$ .

¿Estoy viendo esto de la manera correcta? ¿Es ésta la solución correcta?

1 votos

Esto es correcto. También puede utilizar la fdc Normal, ya que $X=\exp\{Z\}$ con $Z$ una variante Normal.

4voto

Jeff Bauer Puntos 236

El OP ha utilizado implícitamente una longitud de paso igual a $1$ para el soporte de su variable aleatoria discreta. En la práctica, esto puede ser un paso demasiado grande, sobre todo si la desviación típica es pequeña. De forma más general, y manteniéndonos en el marco de las variables aleatorias no negativas, podemos definir el soporte de la variable aleatoria discreta como

$$S_Y = \{0, h, 2h , 3h,...\}, h \in \mathbb Q_+$$

... donde para mantener las cosas manejables, designamos un soporte igualmente espaciado (aunque esto no es en absoluto necesario).

Desde las rondas OP abajo los valores que obtiene, tenemos

$$\text {Prob}(Y = kh) = \text {Prob}(X < (k+1)h) - \text {Prob}(X < kh), \;\;k=0,1,...$$

y debido a la continuidad de $X$

$$\text {Prob}(Y = kh) = \text {Prob}(X \leq (k+1)h) - \text {Prob}(X \leq kh)$$

que en nuestro caso se convierte en

$$\text {Prob}(Y = kh) = \Phi\left(\frac {\ln [(k+1)h] - \mu}{\sigma}\right)-\Phi\left(\frac {\ln [kh] - \mu}{\sigma}\right)$$

donde $\Phi()$ es la FDA normal estándar.

Tenga en cuenta que $k$ no deben seguir necesariamente a los Naturales uno a uno - podríamos tener por ejemplo de nuevo un soporte igualmente espaciado como $S_Y = \{0, 2h , 4h, 6h,...\} $ etc.

Desde el punto de vista de la codificación, la formulación anterior ofrece flexibilidad para explorar la estructura del apoyo que mejor se adapte a las necesidades.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X