Trabajo con R y digamos que tengo un juego de trenes y un juego de pruebas. Quiero probar diferentes algoritmos (por ejemplo, redes neuronales y svm).
Voy a realizar una primera validación cruzada de 10 veces en mi conjunto de entrenamiento para afinar la red neuronal.
Luego realizaré una validación cruzada de 10 veces en mi conjunto de trenes para afinar el svm.
Y compararé el rendimiento de cada uno de los mejores modelos en mi conjunto de pruebas.
Me preguntaba si era teóricamente un problema que los 10 pliegues (construidos aleatoriamente) no fueran los mismos en la sintonía de ambos algoritmos.
Creo que esto no debería ser un problema porque el resultado del ajuste debería ser robusto a la elección de los pliegues. Pero aparentemente no es el caso (he leído que sobre knn, con tune.knn del paquete e1071 en R).
Si tenemos que arreglar las divisiones antes de la sintonización, ¿sabes cómo hacerlo en R? No he encontrado la opción adecuada para la función de sintonización del paquete e1071.
¿Es caret un paquete mejor relativamente a este punto? Dado que parece posible repetir la validación cruzada de 10 pliegues al realizar el ajuste, creo que eso podría hacer que los resultados del ajuste sean más robustos y que la comparación de los diferentes modelos sea más legítima.
Gracias por su visión