6 votos

Cómo Hacer un PDF de 'Look' Uniforme?

Deje $X$ ser un normalmente distribuida variable aleatoria con media cero y varianza $\sigma^2$: $X \sim N(0,\sigma^2)$. Deje $Y$ ser una asignación de $X$ en el intervalo de $(0,1)$ utilizando la función sigmoidea: $Y=\text{sig}(X)=\frac{1}{1+e^{-X}}$.

Se puede demostrar que $Y$ tiene la siguiente función de densidad de probabilidad:

$ f_Y (y) = \frac{1}{y(1-y)} \frac{1}{\sqrt{2 \pi \sigma^2}} \exp{\left(-\frac{\left(\ln\frac{y}{1-y}\right)^2}{2\sigma^2}\right)} $

Mi pregunta es: ¿para qué valor de $\sigma$ $f_y (y)$ la más llana? (es decir, es el más similar a una distribución uniforme sobre $(0,1)$).

Es una forma cerrada de solución a este problema es posible?

PS: me voy de la definición de "la más llana" abierta, porque estoy bien con cualquiera que tenga sentido. Por ejemplo, una simple podría ser el que minimiza la integral de $\left[f_Y(y)-1\right]^2$$(0,1)$.

5voto

Halfgaar Puntos 2866

Considere la posibilidad de la expansión en series de Taylor para $f(x) = \frac{1}{1+e^{-x}}$:

$$f(x) \approx \frac12 + \frac{x}{4} - \frac{x^3}{48} + \frac{x^5}{480} + \cdots.$$

Vemos que, aparte de que el término constante, sólo impar de términos en la expansión.

Ahora, echemos un vistazo a la Wiener-Askey polinomio caos representación de una variable aleatoria uniforme mediante una variable aleatoria normal estándar.

Deje $z \sim U(0,1)$$\zeta \sim \mathcal{N}(0,1)$. Aleatoria gaussiana variables pertenecen a la de Gauss-Hermite polinomio caos. Deje $\Phi_i(\zeta)$ representan el $i$ésimo polinomio de Hermite.

Entonces, podemos decir que

$$z = \sum_{i=0}^\infty z_i\Phi_i(\zeta).$$

El $z_i$ coeficientes son deterministas, se pueden calcular a ellos utilizando el método de Galerkin

$$z_i = \frac{\left\langle z\Phi_i(\zeta)\right\rangle}{\left\langle \Phi_i^2\right\rangle} = \frac{1}{\left\langle\Phi_i^2\right\rangle} \int_{-\infty}^\infty z\Phi_i(\zeta) w(\zeta) d\zeta$$ donde $w(\zeta)$ es la función de ponderación que viene de la ortogonalidad de los polinomios. Por supuesto, para los polinomios de Hermite, la función de ponderación es (dentro de una escala de la variable independiente) de la distribución normal de PDF!

La presencia de $z$ en el integrando es problemático, pero podemos deshacernos de ella, echando a $\zeta$ $z$ a un uniforme de la variable aleatoria $u$ mediante el uso de una función inversa de la muestra transformar. Yo te ahorraré los detalles, a menos que usted quiera, pero al final se obtiene una serie de coeficientes.

Como resulta que, al $i$ es par y mayor que cero, el resultado integrando es una función impar! Por lo tanto, nos quedamos con una serie de coeficientes, y una unidad plazo.

Esta unidad plazo, cuando los $i=0$, siempre representa la media de la variable. Dado que la media de $z$ es de 0,5, entonces esperamos que $z_0 = 0.5$.


Ahora, fíjate en la expansión de Taylor. El $x^0$ coeficiente de 0,5, el $x^1$ coeficiente es de 0,25, etc.

Ahora, aquí están los coeficientes de Gauss-Hermite representación de una distribución uniforme:

$$\{ 0.5, .282, 0, -0.0576, 0, 0.01934, \ldots\}.$$

(Nota: estos coeficientes son a escala polinomios de Hermite tal que $\langle \Phi_i\Phi_j \rangle = \delta_{ij}.$)

Estos son los coeficientes de los polinomios, pero si usted sub ellos, obtendrás algo bastante parecido a lo que se muestra en la expansión de Taylor.

Cuantos más términos se toman en el trunca polinomio caos de expansión, el plano que usted consigue. En alrededor de 12 términos, el resultado es casi perfectamente uniforme. Por eso, $\sigma \sim \sqrt{2}/2$ parece una muy buena opción!

2voto

Dado que la desviación estándar de un estándar de la distribución logística es $\pi/\sqrt{3} \approx 1.8138$, me habría imaginado que hubiera sido una buena respuesta.

Pero empíricamente algo como $\sigma=1.6638$ parece producir una función de distribución acumulativa cercana a la de una distribución uniforme en la unidad de intervalo. Aquí "cerca" es la integral del cuadrado de la separación vertical.

En el siguiente gráfico, la línea verde que utiliza $\sigma=\pi/\sqrt{3}$ y el blueline usa $\sigma=1.6638$, mientras que la línea roja es recto, es decir, la función de distribución acumulativa de una distribución uniforme en la unidad de intervalo.

enter image description here

1voto

alberta Puntos 16

Aquí hay otro "razonable". Dado que la mediana y la media son bellas automáticamente, vamos a estar de acuerdo de algún otro parámetro, digamos, el 25% percentil. Debemos tener $P(X>\log 3)=\frac 14$ donde $P(Z>\frac{\log 3}{\sigma})=\frac 14$ donde $Z$ es la normal estándar. Ahora, buscando en las tablas de Distribución Normal, obtenemos $\sigma\approx 1.6$. No se ve demasiado mal en el gráfico y dudo que alguna mayor precisión hace mucho sentido sin una definición exacta de la llanura...

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X