6 votos

¿Por qué rebanada sampler usa el registro de la densidad?

El sector sampler1 toma como argumento el registro de la densidad a ser muestreado.

¿Por qué está haciendo esto? Un comentario en esta pregunta, señaló que no tiene sentido "muestra" en el registro de la densidad, ya que es a menudo un valor negativo. Por qué entonces, el sector sampler tomar el registro de la densidad, y cómo es que todavía funcionan?

Código Radford M. Neal de la Rebanada de sampler, en su página web: http://www.cs.toronto.edu/~radford/ftp/slice-R-prog

1Neal, Radford M: Rebanada de muestreo, Anales de Estadística 31(3), 705-741, 2003

7voto

AdamSane Puntos 1825

El sector sampler no "muestra del registro de densidad". Puede, sin embargo, utilizar el registro de densidad en los cálculos para obtener un dependiente de la secuencia de observaciones de la densidad.

La idea básica de una rebanada de sampler es en términos de la densidad de la misma, pero por diversas razones (precisión de cálculo, principalmente) generalmente es más conveniente trabajar con el registro de densidad.

Como siempre que hacer todo de tal manera como para ser completamente compatible con la de ella en términos de la densidad, no hay ningún problema cualquiera que sea el trabajo con el registro de densidad.

La descripción para el caso univariante en wikipedia aquí dice:

  • Dada una muestra $x$ elegimos $y$ uniformemente al azar en el intervalo de $[0, f(x)]$;
  • dado $y$ elegimos $x$ uniformemente al azar de entre el conjunto de $f^{-1}[y, +\infty)$.
  • La muestra de $x$ se obtiene haciendo caso omiso de la $y$ valores.

El primer paso puede ser sustituido mediante el muestreo de una distribución exponencial negativa en $-\log y$ donde el límite inferior de la exponencial es en $-\log(f(x))$; el resto del algoritmo (con el obvio cambio para acomodar el hecho de que tenemos una escala logarítmica $y$) del producto tanto como antes. El resultado es exactamente como si hubiéramos con precisión muestreados de acuerdo con el algoritmo original, que se presentan en términos de muestreo de manera uniforme en virtud de la densidad de la misma en $x$ ... pero en la práctica el cálculo en el registro de escala hace que el trabajo de "mejor"- con menos precisión de la pérdida.

Neal se explica la motivación para esto muy claramente en los Anales papel en el que se incluye una referencia para (p712):

En la práctica, a menudo es más seguro para calcular $g(x)=\log(f(x))$ en lugar de $f(x)$, con el fin de evitar posibles problemas con punto flotante de subdesbordamiento. Uno puede a continuación, utilice la variable auxiliar $z=\log(y)=g(x_0)−e$, donde $e$ es exponencialmente distribuida con una media de uno, y se define el segmento por $S={x:z<g(x)}$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X