Soy relativamente nuevo en la aplicación de procesos gaussianos a los datos. Tengo formación matemática, pero la bibliografía más difundida sobre el tema parece proceder de una perspectiva de aprendizaje automático y no de una perspectiva de procesos estocásticos/teoría de la medida.
De todos modos, me piden que ajuste un proceso gaussiano a los datos, es decir GP(x)∼N(μ(x),σ2(x)). El modelo en el que se basan los datos supone que para x1≠x2 , GP(x1) y GP(x2) son independientes. Además, especificamos formas paramétricas para μ(x),σ2(x) . Estas formas paramétricas se proporcionan ya que tenemos restricciones sobre cómo se comportan la media y la varianza a través de x .
Tengo datos de entrenamiento y datos de validación -- muestras de (xi,GP(xi)) para i=1,…,N para la formación y muestras de (xj,GP(xj)) para j=1,…,M para una validación distinta de la formación.
Utilizando los datos de entrenamiento, formulo la verosimilitud logarítmica negativa (sólo el producto de las fdp) y utilizo el MLE para obtener los parámetros necesarios para las funciones de media y varianza anteriores.
Ahora, quiero evaluar la validez de mi modelo para μ(x) y σ2(x) tomando cada muestra del conjunto de validación, aplicando la transformación GP(xj)−μ(xj)σ(xj) y trazar el histograma para ver si es N(0,1) .
Hasta ahora no he conseguido que el histograma tenga un aspecto agradable y se ajuste al pdf de N(0,1). Mi pregunta es: ¿es realista esperar que uno puede realmente encontrar formas paramétricas para μ(x),σ2(x) ¿para "validar" el uso de un Proceso de Gauss para ajustar los datos? En primer lugar, ¿cómo se comprueba siquiera si se puede aplicar a los datos un Proceso de Gauss de cualquier tipo? (Mi conjunto de datos toma valores positivos y negativos, así que ese es un primer paso).