Como Simone dijo que, generalmente, no es esencial para cada pliegue a ser exactamente el mismo tamaño. Sería perfectamente razonable tener seis pliegues que contiene registros de ocho y cuatro que contiene registros de siete cada uno. Eso es probablemente una mejor solución que tener nueve pliegues de tamaño de siete y empujar el exceso en la última de ellas.
10-fold cross validation suele ser una muy opción razonable, pero usted debe ser consciente de que hay un passel de los enfoques relacionados con el (ver este hilo), y algunos de los que podrían mejores opciones, dependiendo de los detalles de su conjunto de datos. Por ejemplo, si tus clases son muy desequilibrada, puede que desee considerar la posibilidad de estratificado de validación cruzada, que intenta distribuir las clases de manera uniforme a través de los pliegues (por ejemplo, si usted tiene 16 ejemplos de la clase a, que está idealmente se extendieron por todo 10 pliegues, no se agrupan a veces #1 y #2).
Algunos otros esquemas, como 5x2 CV, también tienen relativamente buen propiedades si vas a hacer inferencia sobre la validación cruzada de los resultados.