Me gustaría señalar que soy nuevo en este campo, así que si no soy claro, por favor, perdóname (y corrígeme).
He creado un DoE (Diseño de Experimento) con 11 entradas y 121 carreras. Utilicé un STOA (Strength-Two Orthogonal Array) para rellenar el dominio y realicé mi prueba. He medido 5 salidas , por lo que al final tengo un 121x11
matriz de entrada y un 121x5
matriz de salida. Mi tarea es generar un RSM (Response Surface Model) a partir de estos datos y actualmente estoy utilizando el algoritmo de kriging pero no obtengo buenos resultados en términos de precisión (el RMSE (Root Mean Square Error) es bastante alto).
Mis preguntas son:
- dado que el kriging proviene de aplicaciones geoestadísticas, ¿es correcto decir que funciona bien sólo con espacios 2D o 3D y que pierde su precisión con espacios de alta dimensión? ¿Por qué o por qué no?
- Dado mi conjunto de entrenamiento, ¿cómo puedo elegir el mejor algoritmo que se ajuste a mi RSM?
EDIT1: @whuber - Tengo sus preocupaciones. La verdad es que tengo alguna carencia sobre el análisis de datos y quiero investigarlo. ¿Por dónde puedo empezar? ¿Conoces algunos libros o sitios web?
EDIT2: @GeoMatt22 -
- Realicé una validación cruzada de tipo "Leave-One-Out" y tracé el gráfico real frente al predicho. Para algunas salidas la distribución de los puntos es bastante dispersa y el RMSE es alto. Supongo que debería hacer un análisis de los datos. ¿Qué debería mirar? ¿Varianza de los datos? ¿Covarianza?
- El objetivo es la optimización.
EDIT3: @David Kozak - Gracias por tus observaciones. Voy a echar un vistazo a la Rasmussen y Williams.