Esta es una pregunta muy básica acerca de la validación cruzada. Decir que tengo un tamaño de muestra de 2901(o cualquier difíciles de dividir el número). ¿Cómo puedo dividir este en igualdad de particiones (distinto de n=1)? Y qué tamaño debería hacer cada partición?
Por ejemplo, si yo hago cada tamaño de la partición de 300 (que me da aproximadamente 10 particiones), voy a tener algunos puntos de datos que se encuentran en más de una partición, dando una injusta de peso. Es esto aceptable/¿qué hace la gente normalmente hacer acerca de esto?
Por cierto, quería dividir en igualdad de particiones por lo que fácilmente se puede escribir código que va a realizar la validación cruzada para cualquier número de particiones.