Creo que lo que la persona que hacía la pregunta necesita es simplemente una fórmula más explicativa, o una explicación detallada de la fórmula. Estoy publicando esto por el bien de otros que buscan una respuesta.
Así es como lo entiendo.
-
Empieza con una función de pérdida menos abstracta, digamos el MSE.
-
Una vez que divides tu conjunto de datos en K subconjuntos, calculas el MSE donde el conjunto de prueba es uno de los subconjuntos k y la función f^(-k)(x_i) se calcula sobre el conjunto de entrenamiento formado por todos los puntos menos el subconjunto k. Obtienes
MSE(k)=K/N*sum_{todos los puntos en el subconjunto k} (y_j - f^(-k)(x_i))^2.
Ten en cuenta que para obtener el promedio divides por N/K que es el número de puntos en el subconjunto k.
3. Ahora tomas el promedio sobre todos los K subconjuntos, y obtienes:
MSE = 1/K * sum_k MSE(k)
-
K y K se simplifican y el MSE se convierte simplemente en
MSE = 1/N * sum_{todos los puntos!} (y_j - f^(-k)(x_i))^2
Ten en cuenta que cada punto se cuenta exactamente una vez. Por eso en lugar de f^(-k) puedes escribir como Hastie et al. "f^(-k(i))".
La extensión a una función de pérdida genérica debería ser trivial.
Espero que esto aclare las cosas.
0 votos
Si solo quieres saber cómo hacerlo, ya ha sido respondido, por ejemplo aquí: stats.stackexchange.com/questions/1826/…
0 votos
@mbq: Sé cómo funciona, pero necesito la fórmula matemática para este error de predicción. He aplicado la regresión de Ángulo Mínimo (paquete R 'lars'). Así que estoy buscando la fórmula matemática para este procedimiento de validación cruzada para la función R (cv.lars) en el paquete 'lars'.
0 votos
Bueno, ahora estoy confundido -- ¿a qué te refieres con "fórmula matemática" en este caso?
0 votos
¿Cómo puedo escribir el error de predicción de validación cruzada K-Fold en forma matemática?