Hay una diferencia entre repetidas de validación cruzada y nested-validación cruzada. El último es útil para la determinación de hyper-parámetros y la selección de características.
He visto un par de artículos recientes sobre el sesgo de la varianza implicaciones de repetirse la validación cruzada. Rodríguez y Lozano (IEEE T. PAMI 2010) prueba artificiales conjuntos de datos (basado en parameterisations de un único modelo de mezcla) y a la conclusión de que se repite la validación cruzada es útil y reduce la varianza, mientras que el interior de k-fold cross-validation da un equilibrio entre el sesgo y la varianza (con k = 5 o 10 recomendado para la comparación de algoritmos como un razonable equilibrio) - que se utiliza 10 repeticiones, pero nada de 2 o de 3 a 20 o 30 es razonable en mi experiencia. El exacto equilibrio y la relación con el "verdadero" precisión depende del conjunto de datos.
Vanwinckelen y Blockeel (2012) explorar con 9 de los más grandes conjuntos de datos de la UCI, con subconjuntos de 200 y 1000 utilizados para la validación cruzada, y la totalidad del conjunto de datos utilizado para aproximar la población total. 10-CV normalmente todos, pero un par de "verdadero" precisiones están dentro del intervalo de confianza determinado por el 10-CV, pero para 10x10-CV y 30x10-CV todos, pero un par se encuentran fuera del intervalo de confianza. También para todos, pero un par, la diferencia entre el estimado y verdadero precisión es mejor para el 1000 de las 200 muestras. Estos conjuntos de datos varían en tamaño (y ya se puede utilizar el 30% de los datos) por lo que su representatividad de la población es una suposición injustificada, y este uso es, pues, de hecho, también artificial. Pero los resultados contradictorios de los dos papeles, no obstante, no parece válido para sus datos, sin embargo, pienso que la verdad, y el enfoque ideal, se encuentra en algún lugar entre.
Para CxK-CV aumento de C por un factor de cuatro mitades el tamaño del intervalo de confianza. Pero usted todavía está utilizando los mismos datos de diferentes maneras, y esta aparente reducción de la variación en la final llegan a ser cada vez más falsas (porque la independencia supuesto es violado). Para los datos artificiales con el simple modelo de mezcla en el primer estudio, 10x10-CV parece permanecer dentro de la gama útil, pero para la mayoría de los conjuntos de datos reales, el 10 repeticiones parece ya demasiado.
Yo tiendo a usar 2x5-CV (no 5x2-CV según lo recomendado por Dietterich) si no estoy demasiado apretado en los datos. Donde realmente estamos escarbando para la cantidad suficiente de datos (en muy grande muy difícil de procesamiento de señal de problemas), pero no puede permitirse el lujo de hacer LOO, utilizamos Cx20-CV con C hasta 10, pero el uso de una temprana parada significado, la estimación técnica parar cuando no hay una mejora significativa que se puede esperar, normalmente, evitando la mitad de las pistas, lo que sugiere que la C de 5 es suficiente.
Ver:
David M W Poderes y Adham Atyabi, "El Problema de la Validación Cruzada: un Promedio de Prejuicios, Reptition y Significado", de la Primavera Congreso Mundial de Ingeniería y Tecnología, en Xian, China, en Mayo de 2012, IEEE, Estados Unidos, V2:93-97
Lo que falta en este momento es una buena manera de ver cómo muchas repeticiones son útiles, y cuando la reducción en la varianza creciente CxK-CV pretende lograr en realidad deja de ser real. La repetición contar C de 5 es un compromiso entre el por y en contra de las recomendaciones de los dos artículos que he citado anteriormente, y con el original de la varianza para el intervalo de confianza, y la repetición sólo para mejorar la estimación, es una sugerencia de la agin de papel. Pero realmente necesitamos un método de evaluación cuando esta es, una de las primeras parada técnica como en nuestro papel que evita ser engañados por una subestimación - aunque no vimos ninguna señal de esto en nuestros estudios en datos reales, que realmente no tienen forma de saber como se utilizó toda la información disponible para el CxK-CV.