7 votos

Integración numérica de un conjunto de datos con incertidumbres

Tengo un conjunto de datos 1D {xi, yi} sin incertidumbres en xi y con incertidumbres dyi en yi. La función discreta resultante es monótona y relativamente suave y me gustaría integrar la función.

Si no hubiera incertidumbres, interpolaría los datos (de orden de interpolación 1 o 2) y luego integraría numéricamente la función interpolada. ¿Pero qué hago cuando hay incertidumbres? Supongo que este es un problema bien estudiado pero no puedo localizar ninguna referencia. ¿Conoces alguna referencia?

Estas son mis dos ideas sobre cómo podría proceder.

  1. Técnica rápida. Observa otros dos conjuntos de datos {xi, yi + dyi} y {xi, yi - dyi} que limitan el conjunto original. Interpola e integra como antes. Esto daría un límite superior e inferior a la integral.

  2. Una técnica más complicada. Para cada valor de xi, extraiga un valor de yi' de una distribución normal con media yi y desviación estándar dyi. A continuación, interpola e integra. Hazlo un gran número de veces y encuentra el valor medio y su desviación estándar.

Espero que esto tenga sentido. ¿Comentarios?

1voto

Andre Puntos 515

Para dos puntos de datos $(x_1, y_1)$ y $(x_2, y_2)$ , con incertidumbres $dy_1, dy_2$ respectivamente, la integral de la interpolante lineal es: $$(x_2-x_1)*\tfrac12(y_1+y_2)$$ Si se sustituyen los valores de y por variables aleatorias de distribución normal, $Y_1$ ~ $N(y_1, dy_1), Y_2$ ~ $N(y_2, dy_2)$ se obtiene la misma fórmula con las variables sustituidas. $$(x_2-x_1)*\tfrac12(Y_1+Y_2)$$ El valor esperado para un número elevado de integrales así calculadas es $$\mathbb E((x_2-x_1)*\tfrac12(Y_1+Y_2)) = (x_2-x_1)*\tfrac12(\mathbb E(Y_1)+\mathbb(Y_2)) = (x_2-x_1)*\tfrac12(y_1+y_2),$$ mismo que la integral original sin incertidumbres. Por lo tanto, si no me equivoco, tu método número 2 debería dar en el límite los mismos resultados que si ignoras las incertidumbres.

Si el objetivo es maximizar la suavidad de la interpolante, se podría intentar definir una spline de minimización de energía sujeta a la condición de que $f(x_i) \in [y_i-dy_i, y_i+dy_i]$ .

1 votos

¿No hay un $1/2$ ¿falta en sus fórmulas?

0 votos

@Yann: Sí, por supuesto. Editado, gracias,

0voto

user2566092 Puntos 19546

Según el teorema del límite central, tu segunda aproximación es mucho más sensata si quieres tener una idea de la desviación típica del valor esperado de tu integral, siempre y cuando tu método de interpolación sea sensato y tu función se comporte lo suficientemente bien. Su primer enfoque probablemente se aproximará en exceso o en defecto al valor típico de la integral, a menos que su número de puntos de datos sea pequeño, porque es muy poco probable que subestime notablemente cada valor de su función o sobreestime notablemente cada valor de su función.

0voto

Mark Fischler Puntos 11615

Supongamos que se utiliza un $n$ -a de orden para integrar los valores contrales (ignorando las incertidumbres), y usted se pregunta si debe utilizar un esquema de interpolación de orden superior en su lugar. Entonces, a no ser que las incertidumbres sean muy pequeñas (a escala del $n$ -En el caso de los errores de interpolación de orden superior, el esquema de interpolación de orden superior no puede ayudar (y de hecho, debido a problemas de precisión aritmética - redondeo - lo hará peor que el esquema de orden inferior).

En el mundo práctico, esto suele significar que la interpolación trapezoidal simple (interpolación lineal entre cada par de puntos) es lo más lejos que se puede llegar en la práctica. Si sus incertidumbres son realmente pequeñas, la interpolación cuadrática o cúbica podría ser una mejora, pero esto no es probable en el mundo real.

Y ahora quiere (o debería querer) su incertidumbre en la integral. Aquí, asumiendo las incertidumbres de los puntos individuales en la $y_i$ no están correlacionadas entre sí, se pueden fijar como cero todas las incertidumbres menos una y encontrar fácilmente la contribución de esa única incertidumbre en la integral resultante. Tenga en cuenta que, dado que quiere incertidumbres y no límites (y las incertidumbres de los puntos individuales son típicamente variantes normales, que a su vez no están acotadas), debe añadir las incertidumbres (no correlacionadas) en cuadratura.

Una última sutileza importante sobre las incertidumbres decoradas: existe el peligro real de que $dy_i$ está correlacionada con $dy_j$ cuando $|x_i - x_j| < \delta$ para alguna longitud de correlación $\delta$ . Esto ocurrirá siempre que su "ruido" sea el ruido del proceso en lugar del ruido de la medición. En este caso, no se puede simplemente añadir las contribuciones de la incertidumbre a la integral en cuadratura; hay que multiplicar por un factor que, en los casos más sencillos, es la raíz cuadrada del número típico de puntos $x_i$ que se encuentra dentro de un intervalo $\delta$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X