Estaba tratando de ganar algo de intuición para la regresión del Proceso Gaussiano, así que hice un simple problema de juguete 1D para probar. Tomé $x_i=\{1,2,3\}$ como las entradas, y $y_i=\{1,4,9\}$ como las respuestas. ('Inspirado' de $y=x^2$ )
Para la regresión utilicé una función de núcleo exponencial estándar al cuadrado:
$$k(x_p,x_q)=\sigma_f^2 \exp \left( - \frac{1}{2l^2} \left|x_p-x_q\right|^2 \right)$$
Supuse que había ruido con desviación estándar $\sigma_n$ , por lo que la matriz de covarianza se convirtió:
$$K_{pq} = k(x_p,x_q) + \sigma_n^2 \delta_{pq}$$
Los hiperparámetros $(\sigma_n,l,\sigma_f)$ se estimaron maximizando la probabilidad logarítmica de los datos. Para hacer una predicción en un punto $x_\star$ He hallado la media y la varianza, respectivamente, de la siguiente manera
$$\mu_{x_\star} = k_\star^T (\mathbf{K}+\sigma_n^2\mathbf{I})^{-1} y$$ $$\sigma_{x_\star}^2 = k(x_\star,x_\star)-k_\star^T(\mathbf{K}+\sigma_n^2\mathbf{I})^{-1} k_\star$$
donde $k_\star$ es el vector de la covarianza entre $x_\star$ e insumos, y $y$ es un vector de las salidas.
Mis resultados para $1<x<3$ se muestran a continuación. La línea azul es la media y las líneas rojas marcan los intervalos de desviación estándar.
Sin embargo, no estoy seguro de que esto sea correcto; mis entradas (marcadas con 'X') no se encuentran en la línea azul. En la mayoría de los ejemplos que veo, la media se cruza con las entradas. ¿Es ésta una característica general que cabe esperar?