Estoy utilizando la validación cruzada para estimar el error de predicción de mi modelo. Estoy utilizando una métrica M para medir este error de predicción.
Utilizando el CV de 10 pliegues, obtengo el valor de la métrica M para cada pliegue. (Por favor, ignore SD_M por ahora).
M SD_M
result.1 707.4018 196.3860
result.2 1094.0445 260.6073
result.3 821.9250 181.8182
result.4 656.3086 128.1662
result.5 1096.4073 256.0398
result.6 843.6550 192.0989
result.7 588.9200 136.4374
result.8 928.6556 197.5693
result.9 735.6646 159.7934
result.10 792.4319 194.4807
A partir de aquí, quiero estimar el error de generalización, es decir, quiero una estimación puntual del valor de mi métrica M para nuevos datos arbitrarios.
Elijo razonablemente la media de M entre los pliegues como estimación puntual de mi error de generalización.
Mi pregunta es: ¿Cuál es el error estándar SE de esta estimación puntual? ¿O un intervalo de confianza para esta estimación puntual?
Tengo varias opciones y no sé cuál (o si alguna) es la adecuada: Estoy usando la notación R pero espero que quede claro para todos.
SE = sd( c(707.4018, 1094.0445, ..., 792.4319) )
En este caso, el resultado es SE=171.33
.
SE = sd( c(707.4018, 1094.0445, ..., 792.4319) ) / sqrt(10)
ya que estoy estimando el error estándar de la media.
Esto da como resultado SE=54.17
.
- El
SD_M
es el error estándar de M para cada pliegue. Ya que M es el MSE,SD_M
se obtiene utilizando la fórmula del error estándar de la media de los residuos al cuadrado de este pliegue:SD_M = sd(fold_squared_residuals)/sqrt(fold_size)
.
SE = mean(SD_M)
¡también es un condidato! Su valor es de aproximadamente SE=190.3
.
Estoy bastante confundido, creo que estoy mezclando conceptos. ¿Cuál es el significado de estos 3 valores?
EDIT: He editado (aclarado) bastante la pregunta, así que las respuestas actuales no la abordan realmente. ¡Siéntase libre de tener un ir!
0 votos
No estoy seguro de entender su pregunta, pero este documento puede ser relevante/útil: Bengio & Grandvalet (2003), No Unbiased Estimator of the Variance of K-Fold Cross-Validation ( pdf ).
0 votos
Efectivamente, el documento es muy relevante para mi pregunta, gracias. En cuanto a mi pregunta, ¿puede indicarme qué es lo que no entiende? Dada la falta de respuesta, ¡imagino que no soy tan claro como creía!