¿Qué porcentaje de mi conjunto de entrenamiento debo utilizar para realizar la selección de características?

Question

¿Qué porcentaje de mi conjunto de entrenamiento debo utilizar para realizar la selección de características?

Preguntado el 20 de Noviembre, 2015: Cuando se hizo la pregunta
107 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Tengo un conjunto de datos que tiene 660.000 muestras con 72 características y estoy intentando realizar una selección de características para poder entrenar un clasificador bayes ingenuo. El problema es que como el conjunto de datos es tan grande, no puedo procesar todo el archivo sin que mi ordenador se congele. Originalmente planeé realizar la clasificación de características con ganancia de información tomando sólo una submuestra de los datos. El problema es que cada vez que ejecuto mi programa, obtengo un orden diferente para las características.

Intento averiguar qué porcentaje de datos de formación necesito para obtener una medida precisa de mi ganancia de información.

Preguntado el 20 de Noviembre, 2015 por SiegeX

Answer 1

1 Respuestas

Answer 2

0voto

marsel Puntos 16

¿Y si se toman las puntuaciones medias (o la media dividida por la norma) de todas las ejecuciones y luego se clasifican las características? Por cierto, creo que deberías calcular la importancia de las características a partir del conjunto de pruebas, no del conjunto de entrenamiento.

Respondido el 20 de Noviembre, 2015 por marsel (16 Puntos )

¿Qué porcentaje de mi conjunto de entrenamiento debo utilizar para realizar la selección de características?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Qué porcentaje de mi conjunto de entrenamiento debo utilizar para realizar la selección de características?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: