Estoy realizando una tarea de clasificación de imágenes y el número de características de cada imagen de ejemplo es bastante grande (3.072: # píxeles en cada imagen). Estoy pensando en utilizar PCA para reducir el # características de cada imagen a $n$ (decir $n = 100$ ), y luego usar SVM para aprender y clasificar usando el espacio de características reducido. Me pregunto cuál de estos dos caminos debo seguir.
-
PCA en el conjunto de entrenamiento $T$ y utilizar SVM para aprender sobre nuevos $T$ con dimensiones reducidas. Para la predicción, PCA de nuevo en el conjunto de prueba $S$ y utilizar los parámetros SVM aprendidos para clasificar.
-
PCA en ambos $T$ y $S$ al mismo tiempo. Es decir, fusionar $T+S$ en una gran matriz y aplicarles el ACP. A continuación, dividir la matriz de dimensión reducida en $T$ y $S$ de nuevo. Aprender la SVM en el reducido $T$ y luego utilizar la SVM aprendida para predecir en la reducida $S$ .