21 votos

¿Es mejor hacer análisis exploratorio de datos en el dataset de tren sólo?

Estoy haciendo análisis exploratorio de datos (EDA) en un conjunto de datos. Entonces selecciono algunas de las características para predecir una variable dependiente.

La pregunta es:
¿Debo hacer la EDA en mi dataset de entrenamiento solamente? ¿O debo me uno a la formación y prueba de conjuntos de datos juntos entonces hacer la EDA de ambos y seleccione las funciones basadas en este análisis?

1voto

Lee Puntos 2755

¿Así que quieres identificar las variables independientes que tienen un efecto sobre la variable dependet?

Entonces, sus enfoques son realmente no muy recomendables.

Después de haber definido su pregunta de investigación, debe desarrollar su teoría. Es decir, con la literatura, usted debe identificar las variables que deben tener un efecto (usted debe ser capaz de explicar la razón).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X