4 votos

dato en %

Digamos que tengo un conjunto de datos de $X_1...X_N$ con la clase correspondiente de cada evento $Y(0,1)$. Estoy de formación de este conjunto y obtener un resultado para la clasificación.

¿Qué pasa si yo simplemente duplicar todo el conjunto y piensos, que a mi ML algoritmo? la probabilidad para cada clase sigue siendo la misma. Debo esperar un resultado diferente?

Gracias

1voto

Piotr Puntos 101

Esto dependerá de particular ML algoritmo que se está utilizando. Para algunos puede influir en el resultado, para algunos no.

Con la mayoría de ML algoritmos no importa cuántas veces la alimentación en el aprendizaje conjunto y en qué orden se alimenta.

  • Para muchos algoritmos se producirá exactamente los mismos resultados.
  • Para algunos, los resultados serán diferentes, pero la diferencia debe ser relativamente pequeño. En el caso general de alimentación de datos en múltiples tiempos de no mejorar la eficiencia de clasificación.

Te recomiendo que pruebes con RapidMinder con algunos datos ficticios y diferentes algoritmos de clasificación y comparar el error de clasificación de resultados utilizando diferentes algoritmos y por tanto la alimentación de datos en una y varias veces.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X