5 votos

Cómo construir la probabilidad en este caso donde creo que errores no debe ser gaussiana

Tengo una caja negra código de computadora, que se lleva en la frecuencia de entrada de $\omega$, un vector de otros predictores $\mathbf{x}$, y un vector de parámetros de calibración de $\boldsymbol{\theta}$, y se prevé un vector de salida $\boldsymbol{\eta}$ tiene cuatro componentes. También tengo las mediciones de $\mathbf{y}$ de estas salidas, que difieren de las $\boldsymbol{\eta}$ debido a algún error:

$\mathbf{y}=\boldsymbol{\eta}(\omega,\mathbf{x},\boldsymbol{\theta})+\boldsymbol{\epsilon}$

Tengo un conjunto de datos de $D=\{(\omega_i,\mathbf{x}_i),\mathbf{y}_i\}_{i=1}^N$ y quiero calibrar mi código de computadora a través de la inferencia Bayesiana, es decir, quiero calcular una posterior densidad para ellos, teniendo en cuenta algunas antes. Me pueden escribir los Bayes fórmula:

$p(\boldsymbol{\theta}|D)=\frac{p(D|\boldsymbol{\theta})p(\boldsymbol{\theta})}{\int p(D|\boldsymbol{\theta})p(\boldsymbol{\theta})}$

El problema ahora es que no espero que el error se Gaussiana, por lo que estoy teniendo problemas en la escritura de la probabilidad. El código calcula la rigidez y el amortiguamiento de un avanzado sello de una turbina de gas. Puede obtener más información aquí, aquí y aquí, pero básicamente sólo pensar de un rotor que gira dentro de un estator. Ajuste de un determinado anillo en el estator que tiene la propiedad de hacer que el rotor menos sensibles a la vibración de las inestabilidades, si algunas de las condiciones de diseño se cumplen a la hora de diseñar tu anillo. Ahora, las razones por las que creo que el error no es Gaussiana (y tal vez ni siquiera iid!) son dos:

  1. el sistema que se está probando es un dinámico sistema lineal. Según lo explicado por lineal de la teoría de sistemas, se puede calcular la respuesta de un lineal sistema a frecuencias $\omega_1,\dots,\omega_m$ por emocionante que en todas las frecuencias de una sola vez, en lugar de uno a la vez, porque de la superposición principio. Esto significa que mi $N$ puntos de datos son en realidad derivados de $n=\frac{N}{m}$ experimentos separados, cada uno de ellos con el respuesta del sistema a todos los $m$ frecuencias. Puedo asumir la independencia entre los experimentos, pero creo que no puedo considerar el $m$ resultados de un experimento como independiente.
  2. Los vectores $F=\{\mathbf{y}(\omega_1),\dots,\mathbf{y}(\omega_m)\}$ que son el resultado de un experimento dado no se mide directamente. Cada vector tiene 4 componentes, dos rigideces y dos dampings. Estos son no se mide, pero el desplazamiento en el tiempo del centro de masa de el rotor $x_G(t)$ que se mide. Entonces $X_G(\omega)=\text{fft}(x_G(t))$ se calcula, y un sistema de procedimiento de identificación (básicamente, un sistema lineal es solucionado) se realiza para cada una de las frecuencias, lo que conduce a que el cálculo de $\{\mathbf{y}(\omega_1),\dots,\mathbf{y}(\omega_m)\}$. En otras palabras, puedo decir que

    $F=\mathcal{L}(x_G)$

    donde $\mathcal{L}$ es un operador lineal. Me puede asumir con seguridad que el error de medición en $x_G(t)$ es Gaussiano (el sensor utilizado para la medida está bien caracterizado y calibrado con precisión), pero entonces no tengo idea de lo que se hace del error en $\mathbf{y}$ después de todas estas transformaciones!

Mi problema es, ¿cómo hago para escribir la probabilidad de ahora? Para tener una idea de la condicional distribución de error, me podrían tener una mirada ar los residuos entre los experimentos y mi código de predicciones en $D$. Pero para que se ejecute el código, necesito los valores de los parámetros de calibración, que es lo que quiero para calcular! ¿Cómo puedo continuar aquí?

1voto

HappyEngineer Puntos 136

Usted puede utilizar un modelo mixto para tomar en cuenta el iid-problema. Puede hacer otro predictor, $z_{i}$, $i=1, \dots, n$ indica el número del experimento. $z$ debe ser el de efectos aleatorios. Las variables $\omega$ $x$ seguirá siendo de efectos fijos.

Si usted tiene $y=\mathcal L (x_G)$ donde $\mathcal L$ es un operador lineal y $X_G$ se distribuye normalmente, a continuación, $y$ también se distribuye normalmente.

Si usted mis opciones sugeridas la probabilidad será la densidad de la Matriz de distribución Normal con

$$ n=N\\ p=4\\ M=\begin{pmatrix}\eta(\omega_1, x_1, \theta)\\ \vdots\\ \eta(\omega_N, x_N, \theta)\end{pmatrix}\\ U=Z\Psi Z^T+I_N\\ V=\Sigma $$

donde $Z$ es una matriz con

$$ Z_{ij}=1(\text{observación que pertenece a experimentar j}) $$

y $\Sigma$ es la matriz de covarianza del error y $\Psi$ es la matriz de covarianza de los efectos aleatorios. Si usted asume la linealidad de la $\eta$ $\eta(\omega,x,\theta)=X(\omega,x)\cdot \theta$ donde $X(\omega,x)$ es una matriz, usted debería ser capaz de utilizar modelos mixtos de software directamente de la caja.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X