5 votos

Gauss Proceso de bondad de ajuste

Digamos que tengo una Gaussiana modelo de Proceso $M$ basado en algunos datos de entrenamiento. Ahora tengo un flujo de datos de las muestras de un determinado tamaño de lote que viene.

El GP no modelo de una serie de tiempo, pero tratando de regresión, el valor en ciertas ubicaciones $x$, que será visitado varias veces.

Sé que en algún momento habrá un cambio brusco en la distribución de los datos de los lotes se generan a partir de. (Al menos en ciertos lugares,$x$)

Ahora estoy en busca de una diferencia estadísticamente sonido de forma de detectar este cambio, que es la que quiero encontrar el punto, cuando el médico de cabecera no es un modelo de los datos lo suficientemente bien ya.

Pensé que sería la base esta en la detección de los "grandes" cambios en la probabilidad de la función $L(\theta | x)$. Sin embargo no estoy seguro de cómo interpretar los "grandes" aquí, como los valores de la probabilidad de la función sólo tiene sentido en comparación, sino en su propio.

Nota: estoy pidiendo esto, porque algunas personas han dicho que mi primera pregunta fue demasiado abstracto. Yo no quiero cambiar toda la cuestión, aunque, como ya existían algunas respuestas.

1voto

mat_geek Puntos 1367

¿Qué crees que le podría causar el cambio? Es un cambio en la media, la varianza o algo más? El tipo de cambio que esperar que debe determinar el parámetro que debe hacer la prueba de cambiar. Es este un cambio repentino? Si es así, esto podría hacerse mediante la intervención de análisis de series de tiempo, tal como se hace con Box Jenkins modelos para statiomary Gaussiana de la serie de tiempo. El autobox software puede manejar esto para usted.

0voto

speakman Puntos 186

Lo siguiente es la solución que se me ocurrió. Por favor me corrija si me equivoco :)

Supuestos

El modelo de cambio es brusco.

Idea

Mi idea era la siguiente: se determina la bondad del ajuste por medio de un modelo de comparación. Por lo tanto, creamos un modelo muy simple para los que sabemos cómo calcular la probabilidad. Tan pronto como este modelos es más probable que el original modelo GP suponemos que hubo un cambio de modelo.

Suponemos que los datos de $D$ es normalizado a tener un cero significa.

null modelo de probabilidad

Como una simplificación de la GP elegimos una distribución normal con cero significan y una gran varianza en cada lugar de la prueba.

$\log p(D|M_0) = \sum\limits_{d \in D}\log p(d_i|M_0)$ $d_i = (x_i, y_i)$

$\log p(d|M_0) = -\frac{1}{2}\log(2\pi)-\frac{1}{2}\log(\sigma^2)-\frac{1}{2\sigma^2}x_i^2$

GP modelo de probabilidad

Para un GP con matriz de covarianza $K_y$ la probabilidad está dada por:

$\log p(D|M_{GP}) = -\frac{1}{2}\mathbf{y}^\top K_y^{-1} \mathbf{y} -\frac{1}{2}\log |K_y| -\frac{n}{2}\log{2\pi}$

Tomar una decisión basada en el factor de Bayes

Suponiendo un uniforme antes sobre los modelos, calculamos el registro de factor de Bayes de la siguiente manera:

$\log B_{01} = \log p(D|M_0) - \log p(D|M_{GP})$

De acuerdo a este documento si $\log B_{01}$ es mayor que 2, suponemos que hubo un cambio en el modelo subyacente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X