4 votos

Suavizado de curvas ante la presencia de incertidumbre no gaussiana.

¿Qué opciones están disponibles para suavizar 2-dimensional de datos reales para que las ordenadas de los puntos son reales intervalos de la forma

$(x_j , [y_{j0} , y_{j1}])$

En mi caso, la información es vaga, porque intrínseca de la precisión de la medición, y quiero que el conocimiento de la cantidad que se caracteriza por una distribución uniforme sobre el intervalo $[y_{j0} , y_{j1}]$ (en lugar de Gauss).

Una opción es utilizar un smoothing spline donde la ordenada, los datos se obtienen a ser los medios de los intervalos y los puntos de ponderación inversamente proporcional al tamaño del intervalo (en el caso Gaussiano, supongo que esta sería la desviación estándar en su lugar). Por desgracia, esto favorece la curva de pasar por el medio de los intervalos a pesar del hecho de que no tengo ninguna razón a favor de este.

¿Qué otras opciones están disponibles?

2voto

user10479 Puntos 395

Una posible formulación es a través de procesos de gauss. El desconocido función suave $\eta(x)$ es visto como un proceso estocástico $Y(x)$ con una distribución dada, que puede ser visto como un funcional antes de $\eta(x)$. A continuación, la estimación de $\widehat{\eta}(x)$ puede ser la posterior significa, es decir, la expectativa de $Y(x)$ condicional en el set de las desigualdades $y_{i0} \le Y(x_i)$$Y(x_i) \le y_{i1}$. Sin embargo, no es evidente a encontrar un software de computación de manera eficiente.

Para una solución más práctica, más de la mitad del $y_i:=[y_{i0}+y_{i1}]/2$ puede ser tomado como un respuesta en $x=x_i$ como usted lo hizo. A continuación, la mayoría de los mínimos cuadrados basado suavizado los métodos pueden ser adaptados mediante la resolución de una Programación Cuadrática (QP) problema en lugar de una menos plazas problema: desde QP rutinas están ampliamente disponibles, un programa no será difícil de escribir.

Por ejemplo, una limitada smoothing spline se pueden encontrar por la QP. Deje $\mathbf{y}$ ser el vector de la $n$ a mediados de los puntos de $y_i$, y $\boldsymbol{\eta}$ ser el vector de desconocido $\eta_i:=\eta(x_i)$. En la costumbre de splines de suavizado, la estimación de $\widehat{\boldsymbol{\eta}}$ se encuentra por la minimización de $$ \min_{\boldsymbol{\eta}} \: p \,\|\mathbf{y}-\boldsymbol{\eta}\|^2 + (1-p) \,\boldsymbol{\eta}^{\mathrm{T}} \mathbf{M} \boldsymbol{\eta} $$ donde $\mathbf{M}$ $n\times n$ matriz con rango de $n-2$ dependiendo del diseño puntos de $x_i$, e $0 <p < 1$ es un parámetro de suavizado. Para la limitación de spline, añadimos los dos conjuntos de $n$ restricciones: $\boldsymbol{\eta} \ge \mathbf{y}_0$ $\boldsymbol{\eta} \le \mathbf{y}_{1}$. El vector desconocido $\boldsymbol{\gamma}$ de $n-2$ "coeficientes", es decir, de segundo orden derivados en el interior de los nodos, la cual es necesaria por ejemplo para interpolar está relacionado con $\boldsymbol{\eta}$ a través de $\boldsymbol{\eta} = \mathbf{K}\boldsymbol{\gamma}$ donde la matriz $\mathbf{K}$ con la dimensión de $n \times (n-2)$ se encuentra (así como de $\mathbf{M}$) en la literatura sobre el suavizado de splines. Al menos en una primera aproximación, el parámetro de $p$ puede ser adivinado. Al $p \approx 0$, el alisado, la curva será permitido salir de la a mediados de los puntos y estar cerca de cualquiera de los puntos finales para llegar a un mayor el nivel de suavizado. Sin embargo $p>0$ es necesario tener una matriz positiva definida en la QP. El quadprog paquete de R puede ser utilizado para, por ejemplo, $n \le 100$, y los más grandes problemas que probablemente puede ser descompuesto en bloques.

1voto

mat_geek Puntos 1367

Suavizado de núcleo es posible pero los granos probablemente especiales puede usarse para limitar el barrio alisa ya sabe usted que el término de ruido tiene un rango limitado.

1voto

Jeff Hengesbach Puntos 1639

Yo también podría haber otra fuente de ruido, lo que significa que podría tener la verdadera curva que aparece fuera del intervalo.

En este caso sugiero modelado el error generalizado de la distribución normal, cuya pdf está dada por

$f_X(x; \alpha, \beta, \mu) \equiv \dfrac{\beta}{2\alpha\Gamma(1/\beta)} \; e^{-(|x-\mu|/\alpha)^\beta}$

donde $\Gamma$ denota la función gamma, y se ve como

Generalized normal distribution

Como se puede ver, para grandes valores de la forma de parámetros $\beta$, la densidad es plana alrededor de la media (cero en este ejemplo), la aproximación de una distribución uniforme. (De hecho, converge pointwise para una distribución uniforme en el interior de la $(\mu-\alpha,\mu+\alpha)$$\beta \to \infty$.) Por otra parte, es distinto de cero fuera de $(\mu-\alpha,\mu+\alpha)$, lo que permite que usted cuenta para el resto de las fuentes de ruido.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X