6 votos

Cómo muestrear el valor de la distribución geométrica simétrica

¿Cómo puedo muestrear un valor de una distribución geométrica simétrica, como se define en este enlace .

Allí, la densidad de la distribución geométrica simétrica de la propuesta viene dada por \begin{equation*} f(\theta;p_g)\propto \frac{p_g (1 - p_g)^{|\theta|}}{2(1- p_g)}, \end{equation*} donde la simetría se centra en $\theta$ . Sin embargo, parece que esta distribución no es muy conocida con este nombre. Parece que esta distribución está relacionada de algún modo con la distribución de Laplace, para la que sé cómo muestrear valores, pero no he podido establecer esta relación por mí mismo.

Por ello, mi pregunta es en realidad doble:

  1. ¿Esta distribución se conoce con un nombre más común, y
  2. ¿Hay alguna otra distribución con la que pueda relacionarla para generar valores a partir de esta distribución con mayor facilidad?

3voto

AdamSane Puntos 1825

El documento vinculado no es claro; ni siquiera indica la variable aleatoria (que llamaré llamaré $X$ ). Supongo que significa $p_g$ & $\theta$ son parámetros. No define los valores que toma $X$ - que creo que debería aparecer en el exponente como $|x-\theta|$ no como $|\theta|$ - ni los valores tomados por $\theta$ (que supongo que es entera) y se refiere a la distribución como discreta pero la llama densidad.

Creo que una implementación correcta de una "geometría simétrica" es la siguiente:

$$p_X(x;\theta,p_g)= \frac{p_g (1 - p_g)^{\mid x-\theta\mid}}{2- p_g},\: x\in \mathbb{Z};\, \theta\in \mathbb{Z}, 0<p_g<1$$

(nótese también el cambio en el denominador)

Esta distribución tiene la propiedad de que, a medida que te alejas del centro, la relación de probabilidad con la siguiente probabilidad más alejada en la cola permanece constante (en relación geométrica). Esto es lo que la hace "geométrica".

Este es un ejemplo, con $p_g=0.3$ y $\theta=10$ :

enter image description here

Como ves es simétrico, geométrico y centrado en $\theta$ .

Si la distribución tiene colas (sub)exponenciales, debería funcionar bien como propuesta.

Lo que intentaron definir (pero no lo consiguieron) es ligeramente diferente:

$$p_X(x;\theta,p_g)= \frac{p_g (1 - p_g)^{|x-\theta|}}{2(1- p_g)},\: x\in \mathbb{Z};\, \theta\in \mathbb{Z}, 0<p_g<1$$

Esto no está en proporción geométrica, porque la espiga central es dos veces la altura que debe tener para estar en la misma relación con los valores de los lados que esos valores tienen con los de más allá.

Aunque no creo que merezca el nombre de geométrica simétrica, esta distribución se puede generar generando una geométrica (la versión indexada desde 0), añadiendo un signo aleatorio y desplazando por $\theta$ (es decir, añadir $\theta$ ).

(La que definí al principio es algo más complicada de generar, pero una forma de hacerlo es como la anterior pero si se genera un $-0$ lo tiras y generas de nuevo).


Otra adecuada para colas más pesadas sería un equivalente discreto de una distribución tabla-montaña, como

$$p_X(x;\theta,p_g)= \frac{\min(1,\mid\! x-\theta\!\mid^{-s})}{2\zeta(s)+1},\: x\in \mathbb{Z};\, \theta\in \mathbb{Z},s>1$$

(específicamente con $s=2$ para la propuesta habitual de montaña de la mesa).

Se trata de una versión simétrica de una distribución zeta(s) con un bit "plano" en $\theta$ (en el sentido de que tiene la misma probabilidad que los valores a su lado). Se podría sustituir el valor del numerador por $\theta$ (es decir $1$ ) con un valor positivo arbitrario (si también se fija el denominador), o ampliar la parte "plana" (ídem) o utilizar un $s$ si es necesario.

3voto

Dipstick Puntos 4869

La distribución discreta de Laplace es una muy similar al que usted describe (consulte Inusah y Kozubowski, 2006, y Kotz, Kozubowski y Podgorski, 2012).

La distribución discreta de Laplace tiene función de masa de probabilidad:

$$ f(x) = \frac{1-p}{1+p} p^{|x-\mu|} $$

y la función de distribución acumulativa

$$ F(x) = \left\{\begin{array}{ll} \frac{p^{-|x-\mu|}}{1+p} & x < 0 \\ 1 - \frac{p^{|x-\mu|+1}}{1+p} & x \ge 0 \end{array}\right. $$

El nombre de Laplace discreto proviene del hecho de que si $U \sim \mathrm{Geometric}(1-p)$ y $V \sim \mathrm{Geometric}(1-p)$ entonces $U-V \sim \mathrm{DiscreteLaplace}(p)$ , donde distribución geométrica está relacionada con la distribución discreta de Laplace de forma similar a distribución exponencial está relacionado con Distribución de Laplace .

La toma de muestras es sencilla: se extrae $U$ y $V$ a partir de una distribución geométrica parametrizada por $q = 1-p$ y luego tomar $U-V$ .

En R se implementa en DiscreteLaplace , divulgar y extraDistr paquetes.

A continuación puede ver su distribución (en negro) y la distribución discreta de Laplace (en rojo) parametrizadas por diferentes valores de $p$ (para Laplace discreto por $1-p$ ). Como puedes ver, son diferentes pero la idea que hay detrás es muy similar.

"Symmetric geometric" vs discrete Laplace


Kotz, S., Kozubowski, T., & Podgorski, K. (2012). The Laplace distribution and generalizations: a revisit with applications to communications, economics, engineering, and finance. Springer Science & Business Media.

Inusah, S., y Kozubowski, T.J. (2006). Un análogo discreto de la distribución de Laplace. Journal of statistical planning and inference, 136(3), 1090-1102.

3voto

Ankur Loriya Puntos 160

Estoy de acuerdo con @Glen_b pero creo que la función de probabilidad correcta es

$$f(\theta) = \begin{cases} p_g &\theta = 0\\ \frac{1}{2}p_g(1-p_g)^{|\theta|-1} &\theta \neq 0\end{cases}$$

para los enteros $\theta$ . Esta parece ser la única manera de obtener la varianza correcta, y es la misma que la fórmula dada hasta un escalar. Como ha dicho Glen_b, se puede obtener una extracción de esta distirbución extrayendo de una distirbución geométrica y multiplicando el resultado por una elección aleatoria uniforme de $+1$ o $-1$ . Puedes calcularlo a mano y/o verificarlo por simulación.

También estoy de acuerdo en que la intención es probablemente que el valor propuesto $\theta_{new}$ está destinado a ser $\theta + x$ donde $x$ es un sorteo al azar de $f$ . Esta es la única forma que veo para que el texto de su enlace tenga sentido.

Por desgracia, no podemos saberlo con certeza porque no tenemos acceso a la fuente.

0 votos

Hola Flounderer; en su expresión para $f$ , $\theta$ es la variante aleatoria, supongo. [Lo pregunto porque entonces cómo se explica la parte en la que dice "donde la simetría se centra en $\theta$ "¿tiene sentido? Por el contrario, asumiría que la varianza no coincide porque la calcularon después de estropear la distribución].

1 votos

Sí, lo es. Yo tampoco entiendo lo que quieren decir con eso, pero supongo que se refieren a que la simetría está centrada en el valor actual de $\theta$ . No creo que su fórmula para la varianza pueda ser errónea porque es la fórmula correcta para la varianza que se obtiene si se genera una variante aleatoria geométrica y se multiplica por +1 o -1.

0 votos

Sí, he descubierto cuál es la discrepancia. Esa forma de generar no corresponde en realidad a una función geométricamente decreciente -- la prob en el centro es el doble de lo que debería ser.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X