Por lo que he entendido de las preguntas contestadas anteriormente, se supone que debes hacer tu preprocesamiento en cada conjunto después de dividir tus datos en conjuntos de entrenamiento y de prueba. Pero no estoy seguro de dónde entra el conjunto de validación. ¿Debo preprocesarlo también por separado del conjunto de entrenamiento? ¿O debo preprocesar el conjunto de entrenamiento como un todo y luego separar el conjunto de validación?
Estoy 99% seguro de que hay que hacer los tres por separado, pero la forma en que está redactada mi tarea me hizo dudar, así que pensé en buscar una respuesta/opinión aquí.