TLDR:
Mi conjunto de datos es bastante pequeño (120) muestras. Mientras que hace 10-fold cross validation, debo:
Recoger los resultados de cada prueba de pliegue, concatenar en un vector, y luego calcule el error en este vector de predicciones (120 muestras)?
O debería , en lugar de calcular el error en los resultados puedo obtener en cada pliegue (con 12 muestras por veces), y a continuación, obtener mi último error estimado como el promedio de las 10 veces el error de estimación?
Hay trabajos científicos que sostienen que las diferencias entre estas técnicas?
Antecedentes: la Potencial Relación de Macro/Micro puntuaciones en varias etiquetas de clasificación:
Creo que esta pregunta puede estar relacionada con la diferencia entre micro y Macro de los promedios que se utilizan a menudo en un multi-etiqueta de clasificación de la tarea (por ejemplo, decir 5 etiquetas).
En el multi-etiqueta de configuración, micro promedio de las puntuaciones se calculan mediante la realización de una agregados tabla de contingencia de verdaderos positivos, falsos positivos, verdaderos negativos, falsos negativos para todos los 5 clasificador predicciones en 120 muestras. Esta tabla de contingencia es luego utilizada para calcular la precision micro, micro recordar micro y f-measure. Así que cuando tenemos 120 muestras y cinco de los clasificadores, el micro medidas están calculadas en 600 predicciones (120 muestras * 5 etiquetas).
Cuando se utiliza la Macro variante, uno calcula las medidas de precisión, recall, etc.) de forma independiente en cada etiqueta y, por último, estas medidas son el promedio.
La idea detrás de la diferencia entre micro vs Macro estimaciones pueden ser extendidos a lo que se puede hacer en un K-fold en un problema de clasificación binaria. Por 10 veces podemos promedio de más de 10 valores (Macro medición) o concatenar los 10 experimentos y calcular el micro medidas.
Fondo Ampliado de ejemplo:
El siguiente ejemplo ilustra la pregunta. Digamos que tenemos 12 muestras de prueba y contamos con 10 pliegues:
- Doblar 1: TP = 4, FP = 0, TN = 8 Precisión = 1.0
- Veces 2: TP = 4, FP = 0, TN = 8 Precisión = 1.0
- Veces 3: TP = 4, FP = 0, TN = 8 Precisión = 1.0
- Veces 4: TP = 0, FP = 12, Precisión = 0
- Doble 5 .. 10 Veces: Todos tienen el mismo TP = 0, FP = 12 y Precisión = 0
donde he utilizado la siguiente notación:
TP = # de Verdaderos Positivos, FP = # Falsos Positivos, TN = # de Verdaderos Negativos
Los resultados son:
- Promedio de precisión a través de 10 pliegues = 3/10 = 0.3
- Precisión en la concatenación de las predicciones de los 10 pliegues = TP/TP+FP = 12/12+84 = 0.125
Tenga en cuenta que los valores de 0.3 y 0.125 son muy diferentes!