No he podido encontrar una respuesta a la siguiente cuestión y me siento un poco atascado...
Tengo un conjunto de datos y quiero dividirlo de la siguiente manera:
- 90% para la formación y la validación
- 10% para la prueba
Ahora, quiero usar StratifiedKFold()
en el 90%. Digamos que quiero 10 pliegues. Hago el bucle, obtengo los índices, obtengo los conjuntos de entrenamiento y validación, uso el StandardScaler()
para cada pliegue por separado, entrenar el modelo en cada pliegue, obtener la precisión media.
Después de hacer todo esto, ¿cómo debo utilizar el 10% que queda para las pruebas, dado que no estaba normalizado? ¿Qué me falta?
Gracias