Antes de pasar a la pregunta, permítanme recapitular lo que la importancia de la toma de muestras de variables aleatorias. Supongamos $\xi$ es un valor real variable aleatoria con densidad de $f$, y deje $g:\Bbb R\to \Bbb R$ ser alguna función. La tarea es el uso de Monte-Carlo para el cálculo de la integral $$ \mathsf E[g(\xi)] = \int_\Bbb R g(x)f(x)\mathrm dx \approx \frac1N\sum_{i=1}^N g(\xi^i) $$ donde $\xi^i$ son iid variable aleatoria distribuida como $\xi$. Desde la aproximación de error puede tener una gran variación, la idea de la importancia de muestreo es cambiar una densidad de $\xi$ algunos $\hat f$ y el uso que $$ \int_\Bbb R g(x)f(x)\mathrm dx = \int_\Bbb R g(x)w(x)\hat f(x)\mathrm dx $$ donde la función de ponderación está dada por la fracción $w = f/\hat f$. Como resultado, $$ \mathsf E[g(\xi)] = \mathsf E[g(\hat \xi)w(\hat \xi)] \approx \frac1N\sum_{i=1}^N g(\hat\xi^i)w(\hat\xi^i) $$ donde $\hat\xi^i$ son iid con densidades $\hat f$. Entonces uno se encuentra con el problema de optimización para encontrar la mejor opción de $\hat f$, que es la que minimiza la varianza.
En mi caso tengo un problema similar. Vamos a considerar un discreto tiempo de proceso estocástico $X$ con un espacio de estado $E$, dado por el estocástico diferencia ecuación de la forma $$ X_{k+1} = r(X_k,\eta_k), \quad X(0) = x\in E, \etiqueta{1} $$ donde $\eta_k$ es una secuencia de iid real con valores de variables aleatorias con densidad $h$, e $r$ es una forma conjunta medibles función. Deje $\mathsf P$ ser inducida por la probabilidad de medir en $E^{n+1}$ y deje $A$ ser medibles subconjunto de $E^{n+1}$. Estoy interesado en utilizar importancia de muestreo para evaluar $\mathsf P(A)$.
El método de la importancia de muestreo descrito anteriormente se extiende fácilmente para el caso de elementos aleatorios con un rango de $\Bbb R^m$, cuando su densidad es precisamente conocido. En mi caso $E$ es un subconjunto de a $\Bbb R^m$, y sé que la función de $h$, pero sería casi imposible obtener una expresión de la densidad de $X = (X_0,X_1,\dots,X_n)$ ya que la función $r$ puede tener una muy complicado forma. Debido a esta razón, puedo restringir el mismo a cambio de $\mathsf P$ que es inducida por el cambio de la distribución de $\eta$: $$ \begin{align} \mathsf P(A) &= \int_{E^{n+1}} 1_A(x_0,\dots,x_n)\mathsf P(\mathrm dx_0\times\dots\times\mathrm dx_n) \\ & = \int_{\Bbb R^n}1_A(R(y_0,\dots,y_n))h(y_0)\dots h(y_{n-1})\mathrm dy_0\times\dots\times \mathrm dy_{n-1} \\ & = \int_{\Bbb R^n}1_A(R(y_0,\dots,y_n))w(y_0,\dots,y_{n-1})\hat h(y_0)\dots \hat h(y_{n-1})\mathrm dy_0\times\dots\times \mathrm dy_{n-1} \\ & = \mathsf E[1_A(\hat X_0,\dots,\hat X_n)w(\hat \eta_0,\dots,\hat \eta_{n-1})] \end{align} $$ donde $R$ es una función que para cada ruido de realización $(\eta_0,\dots,\eta_{n-1})$ da la ruta de acceso del proceso de $(X_0,\dots,X_n)$ según $(1)$, y más $\hat h$ es una nueva densidad, $\hat \eta_k$ son distribuidos de acuerdo a la $\hat h$, $$ (\hat X_0,\dots,\hat X_n) \sim R(\hat \eta_0,\dots,\hat\eta_{n-1}) $$ se distribuye de acuerdo a la nueva distribución del ruido.
Mi pregunta es la siguiente: en caso que debo hacer, importancia toma de muestras de $(1)$, necesito realizar el cambio de la medida de $\mathsf P$ algunos $\hat{\mathsf P}$ de tal manera, que puedo obtener de una forma explícita de la Radon-Nikodym derivado $w = \mathrm d\mathsf P/\mathrm d\hat{\mathsf P}$.
Es la manera que he descrito, el único que garantiza el conocimiento explícito de la forma de $w$? Estoy bastante seguro de que habrá algo de literatura sobre la importancia de muestreo estocástico de ecuaciones de diferencia que se ocupa de estos problemas, pero no encontré nada especialmente adecuado todavía.
Se le preguntó sobre el MSE, pero no recibe mucha atención.