Además de la de @Dahn buena respuesta He pensado en tratar de decir un poco más sobre el origen de las funciones de Bessel y Gamma. Un punto de partida para llegar a la función de covarianza es Teorema de Bochner .
Teorema (Bochner) Una función estacionaria continua $k(x, y) = \widetilde{k}(|x − y|)$ es positiva definida si y sólo si $\widetilde{k}$ es la transformada de Fourier de una medida positiva finita: $$\widetilde{k}(t) = \int_{\mathbb{R}} e^{−iωt}\mathrm{d}µ(ω) .$$
De esto se puede deducir que la matriz de covarianza de Matérn se deriva como la transformada de Fourier de $\frac{1}{(1+\omega^2)^p}$ (Fuente: Durrande) . Eso está muy bien, pero no nos dice realmente cómo se llega a esta medida positiva finita dada por $\frac{1}{(1+\omega^2)^p}$ . Pues bien, es la densidad espectral (de potencia) de un proceso estocástico $f(x)$ .
¿Qué proceso estocástico? Se sabe que un proceso aleatorio en $\mathbb{R}^d$ con una función de covarianza Matérn es una solución de la ecuación diferencial parcial estocástica (EDP) $$ (κ^2 − ∆)^{α/2} X(s) = φW(s), $$ donde $W(s)$ es un ruido blanco gaussiano con varianza unitaria, $$\Delta = \sum_{i=1}^d \frac{\partial^2}{\partial x^2_i}$$ es el operador de Laplace, y $α =ν + d/2$ (Creo que esto está en Cressie y Wikle ).
¿Por qué elegir este proceso SPDE/estocástico en particular? El origen está en la estadística espacial, donde se argumenta que es la covarianza más simple y natural que funciona bien en $\mathbb{R}^2$ :
La función de correlación exponencial es una correlación natural en una dimensión, ya que corresponde a un proceso de Markov. En dos dimensiones dos dimensiones, esto ya no es así, aunque la exponencial es una función de correlación en los trabajos geoestadísticos. Whittle (1954) determinó la correlación correspondiente a una ecuación diferencial estocástica de tipo Laplace:
$$ \left[ \left(\frac{\partial}{\partial t_1}\right)^2 + \left(\frac{\partial}{\partial t_2}\right)^2 - \kappa^2 \right] X(t_1, t_2) = \epsilon(t_1 , t_2) $$ donde $\epsilon$ es ruido blanco. El proceso discreto correspondiente es una autoregresión de segundo orden de segundo orden. (Fuente: Guttorp&Gneiting)
La familia de procesos incluidos en la SDE asociada a la ecuación de Matérn incluye la $AR(1)$ Modelo Ornstein-Uhlenbeck de la velocidad de una partícula en movimiento browniano. De forma más general, se puede definir un espectro de potencia para una familia de $AR(p)$ procesos para cada número entero $p$ que también tienen una covarianza de la familia Matérn. Esto es en el apéndice de Rasmussen y Williams.
Esta función de covarianza es no está relacionado con el proceso de agrupación de Matérn .
Referencias
Cressie, Noel, y Christopher K. Wikle. Estadística para datos espacio-temporales. John Wiley & Sons, 2015.
Guttorp, Peter, y Tilmann Gneiting. "Estudios en la historia de la probabilidad y la estadística XLIX Sobre la familia de correlación de Matern". Biometrika 93.4 (2006): 989-995.
Rasmussen, C. E. y Williams, C. K. I. Gaussian Processes for Machine Learning. MIT Press, 2006.