Estoy haciendo análisis exploratorio de datos (EDA) en un conjunto de datos. Entonces selecciono algunas de las características para predecir una variable dependiente.
La pregunta es:
¿Debo hacer la EDA en mi dataset de entrenamiento solamente? ¿O debo me uno a la formación y prueba de conjuntos de datos juntos entonces hacer la EDA de ambos y seleccione las funciones basadas en este análisis?