Tengo una caja negra código de computadora, que se lleva en la frecuencia de entrada de $\omega$, un vector de otros predictores $\mathbf{x}$, y un vector de parámetros de calibración de $\boldsymbol{\theta}$, y se prevé un vector de salida $\boldsymbol{\eta}$ tiene cuatro componentes. También tengo las mediciones de $\mathbf{y}$ de estas salidas, que difieren de las $\boldsymbol{\eta}$ debido a algún error:
$\mathbf{y}=\boldsymbol{\eta}(\omega,\mathbf{x},\boldsymbol{\theta})+\boldsymbol{\epsilon}$
Tengo un conjunto de datos de $D=\{(\omega_i,\mathbf{x}_i),\mathbf{y}_i\}_{i=1}^N$ y quiero calibrar mi código de computadora a través de la inferencia Bayesiana, es decir, quiero calcular una posterior densidad para ellos, teniendo en cuenta algunas antes. Me pueden escribir los Bayes fórmula:
$p(\boldsymbol{\theta}|D)=\frac{p(D|\boldsymbol{\theta})p(\boldsymbol{\theta})}{\int p(D|\boldsymbol{\theta})p(\boldsymbol{\theta})}$
El problema ahora es que no espero que el error se Gaussiana, por lo que estoy teniendo problemas en la escritura de la probabilidad. El código calcula la rigidez y el amortiguamiento de un avanzado sello de una turbina de gas. Puede obtener más información aquí, aquí y aquí, pero básicamente sólo pensar de un rotor que gira dentro de un estator. Ajuste de un determinado anillo en el estator que tiene la propiedad de hacer que el rotor menos sensibles a la vibración de las inestabilidades, si algunas de las condiciones de diseño se cumplen a la hora de diseñar tu anillo. Ahora, las razones por las que creo que el error no es Gaussiana (y tal vez ni siquiera iid!) son dos:
- el sistema que se está probando es un dinámico sistema lineal. Según lo explicado por lineal de la teoría de sistemas, se puede calcular la respuesta de un lineal sistema a frecuencias $\omega_1,\dots,\omega_m$ por emocionante que en todas las frecuencias de una sola vez, en lugar de uno a la vez, porque de la superposición principio. Esto significa que mi $N$ puntos de datos son en realidad derivados de $n=\frac{N}{m}$ experimentos separados, cada uno de ellos con el respuesta del sistema a todos los $m$ frecuencias. Puedo asumir la independencia entre los experimentos, pero creo que no puedo considerar el $m$ resultados de un experimento como independiente.
Los vectores $F=\{\mathbf{y}(\omega_1),\dots,\mathbf{y}(\omega_m)\}$ que son el resultado de un experimento dado no se mide directamente. Cada vector tiene 4 componentes, dos rigideces y dos dampings. Estos son no se mide, pero el desplazamiento en el tiempo del centro de masa de el rotor $x_G(t)$ que se mide. Entonces $X_G(\omega)=\text{fft}(x_G(t))$ se calcula, y un sistema de procedimiento de identificación (básicamente, un sistema lineal es solucionado) se realiza para cada una de las frecuencias, lo que conduce a que el cálculo de $\{\mathbf{y}(\omega_1),\dots,\mathbf{y}(\omega_m)\}$. En otras palabras, puedo decir que
$F=\mathcal{L}(x_G)$
donde $\mathcal{L}$ es un operador lineal. Me puede asumir con seguridad que el error de medición en $x_G(t)$ es Gaussiano (el sensor utilizado para la medida está bien caracterizado y calibrado con precisión), pero entonces no tengo idea de lo que se hace del error en $\mathbf{y}$ después de todas estas transformaciones!
Mi problema es, ¿cómo hago para escribir la probabilidad de ahora? Para tener una idea de la condicional distribución de error, me podrían tener una mirada ar los residuos entre los experimentos y mi código de predicciones en $D$. Pero para que se ejecute el código, necesito los valores de los parámetros de calibración, que es lo que quiero para calcular! ¿Cómo puedo continuar aquí?