Tengo un ruidoso de la temperatura (T) frente al tiempo (t) de medición y quiero calcular dT/dt. Si me aproximado de $dT/dt = \Delta T/\Delta t$, entonces el ruido en la derivada es demasiado alto y la derivada se convierte en inútil. Así que me ajuste un smoothing spline (parámetro de suavizado decir 'p') para los datos medidos y obtenga $dT/dt$ por tramos de diferenciación de la spline. Hay una manera de obtener la incertidumbre en esta $dT/dt$ sobre la base de la incertidumbre en T?
Respuestas
¿Demasiados anuncios?Modelo de dos mediciones consecutivas como los valores reales, además de algunos de ruido. Llamar a la primera mide la temperatura de la $T_1$ y el segundo $T_2$. Llame a la medición de los ruidos de la $\gamma_1$$\gamma_2$, y supongamos que proceden de una distribución $\Gamma(\gamma)$ y no están correlacionados.
El (aproximación a la derivada es
$$\text{Derivative} \approx \frac{(T_2 + \gamma_2) - (T_1 + \gamma_1)}{\Delta t} \, .$$
Tenga en cuenta que la derivada es en sí misma una variable aleatoria debido a que el $\gamma$'s son variables aleatorias. ¿Cuál es la distribución de probabilidad de esta nueva variable aleatoria?
Centrarse en primer lugar en el numerador. Aquí tenemos una parte determinista $T_2 - T_1$ y un estocástico parte $\gamma_2 - \gamma_1$. El truco cosa que usted no puede saber es cómo calcular la distribución de probabilidad de la suma o diferencia de dos variables aleatorias; en realidad la respuesta no es en absoluto trivial. Dadas dos variables aleatorias $x$ $y$ con distribuciones $X(x)$$Y(y)$, la variable aleatoria $z$ definido por $z = x + y$ distribución
$$ Z(z) = (X \otimes Y)(z) \equiv \int_{-\infty}^\infty X(w) Y(z - w) \, dw \, .$$
Esta integral se llama una convolución. De todos modos, el punto es que la distribución de probabilidad $P_{\gamma_2 - \gamma_1}$ $\gamma_2 - \gamma_1$ es la convolución de las distribuciones de $\gamma_2$$-\gamma_1$, que es
$$P_{\gamma_2 - \gamma_1}(\gamma) = \int_{-\infty}^\infty \underbrace{\Gamma(-\gamma')}_{\text{de }-\gamma_1} \underbrace{\Gamma(\gamma \gamma')}_{\text{de }\gamma_2} \, d \gamma' \, .$$
Como un ejemplo, supongamos que el ruido es Gaussiano distribuido con una desviación estándar $\sigma$,
$$\Gamma(\gamma) = \frac{1}{\sqrt{2 \pi} \sigma} \exp\left(\frac{-\gamma^2}{2 \sigma^2} \right) \, .$$
En este caso podemos hacer la integral, y el resultado es
$$P_{\gamma_2 - \gamma_1}(\gamma) = \frac{1}{\sqrt{2\pi} (\sqrt{2} \sigma)} \exp \left( \frac{-\gamma^2}{2 (\sqrt{2}\sigma)^2}\right) \, ,$$
que es sólo una Gaussiana con una desviación estándar $\sqrt{2} \sigma$. Ahora recuerdo que también se dividen por $\Delta t$, y ello modifica la distribución. El resultado es que la distribución de probabilidad es todavía una Gaussiana, donde la desviación estándar resulta ser $\sqrt{2}\sigma / \Delta t$.
Así que su respuesta: el error en la derivada es completamente descrita por una distribución de probabilidad Gaussiana con una desviación estándar $\sqrt{2} \sigma / \Delta t$.
Me gustaría evitar el uso de una spline en el análisis de datos en general. El spline dibuja curvas suaves a través de arbitraria de conjuntos de puntos, pero destruye una gran parte de la información en los puntos y añade extrañas, sin sentido "de la información". Uso para hacer las cosas bastante, no para el análisis, a menos que usted realmente cree que los datos que debe seguir una alimentación de la serie (lo cual sería bastante inusual de datos).
Me gusta @DanielSank la respuesta de muchos (y he votado), ya que conduce a las buenas maneras de caracterizar el ruido en los datos. Aquí es un "tosco" la respuesta que usted podría encontrar más fáciles de usar con los datos típicos. Es bastante crudo y sólo será válida si la temperatura varía lentamente en comparación a su frecuencia de muestreo.
Si su temperatura varía suavemente en comparación con su frecuencia de muestreo, $1/\Delta t$, en lugar de tomar una spline sólo podría "bin" de las mediciones, de manera que cada grupo de $n$ sucesivas mediciones promedio en una sola medición de la temperatura. Así que usted está reemplazando su $N$ mediciones de temperatura con $N/n$ mediciones de temperatura. Ahora se puede estimar la incertidumbre de cada una de estas medidas simplemente como la desviación estándar de la media (SDOM, una.k.una. error estándar) de las mediciones en las que bin. Ahora usted tendrá mucho menos ruidoso de datos y usted puede hacer el numéricos derivados como lo haría normalmente.
El Peligro Robinson
Hacer esto sólo si está seguro de que su temperatura varía suavemente. Incluso entonces es muy crudo.
Si, más tarde, la necesidad de tomar una transformada de Fourier porque quieres conocer la gama de variación de la temperatura, a continuación, este agrupamiento se han "cortado" la alta frecuencia del espectro.
Respuesta a la OP puede obtenerse fácilmente utilizando el Savitzky-Golay (SG) de suavizado a la diferenciación de filtro. Supongamos que tenemos ruidoso $n$-punto de datos tales como la temperatura ($T$) vs tiempo ($t$) como en el OP. Según el OP queremos para suavizar los datos, encontrar la tasa de tiempo de cambio, y la incertidumbre de que el SG procedimiento de introducir en la tasa de tiempo de cambio. La SG método funciona de la siguiente manera:
El Savitzky-Golay procedimiento de ajuste a un polinomio de grado $m$ a los datos contenidos en una ventana de tamaño $2w+1 << n$. De interés en la operación a través de una ventana en particular es determinar la suave temperatura, la derivada, y la derivada de la incertidumbre SÓLO en el centro de esta ventana . Después, la ventana se mueve a través de los datos de modo que las cantidades de interés puede ser calculado en cada punto de datos. Para ilustrar cómo funciona el método que yo he utilizado $m$=2. Considerar el procedimiento operativo en una ventana centrada en el punto en $j$. En este caso, el polinomio de ajuste es: $$T_j=b_{0,j}+b_{1,j}\bar t+b_{2,j}{\bar t}^2$$ donde $\bar t=(t-t_j)/\Delta t$ , es decir, el eje de abscisas de puntos de datos en la ventana relativa a la abscisa del centro de la ventana de punto , normalizado por el espaciado entre los puntos de datos . En términos simples, $\bar t$ representa la abscisa de la distancia de puntos de datos en $t$ en una ventana en el centro de la ventana en $t_j$ en las unidades de la espaciado $\Delta t$. Con esta transformación $b_0$, $b_1/\Delta t$, y $\delta (b_1/\Delta t)$, respectivamente, son de la suave temperatura, la derivada de la temperatura con el tiempo, y la incertidumbre de la derivada de la temperatura en $t_j$ (centro de la ventana). El ajuste de los parámetros de la ventana de $j$ están dados por:
$$b_{0,j}=\sum_{i=-w}^{w}C_{0i,j}T_{i,j}$$ $$b_{1,j}=\sum_{i=-w}^{w}C_{1i,j}T_{i,j}$$ $$b_{2,j}=\sum_{i=-w}^{w}C_{2i,j}T_{i,j}$$
En estas expresiones de los coeficientes de $C_{0i,j}$, $C_{1i,j}$, y $C_{2i,j}$ son obtenidos por el procedimiento ideado por Savitzky Golay. El ajuste de la incertidumbre por la ventana de $j$ es entonces:
$$\delta_j=\sqrt{\frac{1}{2w-1}\sum_{i=-w}^{w}(T_{i,j}-T_j(t_i))^2}$$
que cuando se propaga a través de la expresión de $b_{1,j}$ rendimientos $\delta {b_{1,j}}$, lo que la incertidumbre en el tiempo derivado de la temperatura. Nota esta incertidumbre es puramente viene desde el suavizado de procedimiento, de modo que por la elección de determinados valores de $m$ $w$ la incertidumbre puede hacerse tan pequeña como se requiere. El resultado de este procedimiento con $w$=10 se muestra a continuación: