He realizado una búsqueda aleatoria en el espacio de hipótesis $$\{(c,h)| c \in U[1,256]; h\in U[1,100];c \in \mathrm{Z} \text{ and } h \in \mathrm{Z}\}$$ que define los parámetros de una norma de tipo perceptrón multicapa (MLP) de la red neuronal.
En cada paso de la búsqueda aleatoria, yo dibuje dos parámetros $c$ y $h$. $c$ define el número de características de entrada y $h$ define el número de nodos de la capa oculta. $c$ $h$ son enteros procedentes de una distribución uniforme definido anteriormente. Me entrenar una red neuronal definido por $(c,h)$ y calcular una tasa de error en la clasificación y el promedio del cuadrado de la tasa de error para cada modelo. Esto se hace con $10$-fold cross-validation para estimar el verdadero error para cada una de las $(c,h)$. Por lo tanto, tengo un promedio de la tasa de error en la clasificación y un promedio al cuadrado de la tasa de error sobre los conjuntos de tren y de la izquierda, se establece para cada par de parámetros.
La pregunta es, ¿cómo elijo la mejor pareja de $(c,h)$ y es el método que yo uso aquí suficiente? No es razonablemente claro punto en los resultados como yo había esperado.
Los resultados sobre la hipótesis de espacio en los datos de entrenamiento es:
Los resultados sobre la hipótesis de espacio en la bodega, entrada-salida de datos es,
Esta pregunta se refiere a trabajo que he realizado como parte de mi tesina de master, y está relacionado con la cuestión que aquí esta