Realmente depende de la cantidad de datos que tiene, el coste específico de los métodos y exactamente cómo usted quiere que su resultado.
Algunos ejemplos:
Si usted tiene pocos datos, es probable que desee utilizar la validación cruzada (k-fold, leave-one-out, etc.) El modelo probablemente no tendrán recursos para entrenar y probar de todos modos. Son buenas maneras de obtener el máximo provecho de sus datos
Usted tiene un montón de datos: usted probablemente desee tomar un razonablemente grande de la prueba de conjunto, asegurando que habrá pocas posibilidades de que algún extraño muestras le dan a la parte de la varianza de los resultados. La cantidad de datos que debe tomar? Esto depende totalmente de sus datos y el modelo. En reconocimiento de voz, por ejemplo, si usted podría tomar demasiado de datos (digamos 3000 oraciones), los experimentos pueden tomar varios días, como en tiempo real factor de 7-10 es común. Si usted tomaría demasiado poco, demasiado dependiente de los altavoces que usted está eligiendo (que no están permitidos en el conjunto de entrenamiento).
Recordar también, que en muchos casos es bueno tener una validación/desarrollo demasiado!