Nota: Caso n>>p
Estoy leyendo Elementos de Aprendizaje Estadístico y hay varias menciones sobre la forma "correcta" de hacer la validación cruzada( por ejemplo, la página 60, en la página 245). Específicamente, mi pregunta es cómo evaluar el modelo final (sin prueba) utilizando k-fold CV o bootstrapping cuando se ha realizado un modelo de búsqueda? Parece que en la mayoría de los casos (ML algoritmos sin incrustado de selección de función) habrá
- Una selección de la función de paso
- Una meta de la selección de parámetros paso (por ejemplo, el costo de parámetros en SVM).
Mis Preguntas:
- He visto que la selección de la función de paso se puede hacer donde la selección de características se realiza en todo el conjunto de entrenamiento y se celebró un lado. Luego, utilizando k-fold CV, el algoritmo de selección de características se utiliza en cada pliegue (obtención de diferentes características, posiblemente, elegido cada vez) y el error promedio. A continuación, utilice la característica seleccionada usando todos los datos (que fueron dejadas de lado) para entrenar la final de la modalidad, pero uso el error de la validación cruzada como una estimación de la evolución futura de la modelo. ES ESTO CORRECTO?
- Cuando usted está utilizando validación cruzada para seleccionar los parámetros del modelo, a continuación, cómo estimar el rendimiento del modelo después? ES EL MISMO PROCESO COMO #1 por ENCIMA O SE DEBE UTILIZAR ANIDADA CV COMO se MUESTRA EN la PÁGINA 54 (pdf) O ALGO MÁS?
- Cuando usted está haciendo ambos pasos (función y ajuste de parámetros).....entonces, ¿qué hacer? complejo de bucles anidados?
- Si usted tiene una separada mantenga fuera de la muestra, es la preocupación desaparece y puede utilizar la validación cruzada para seleccionar las funciones y los parámetros (sin preocuparse ya que su rendimiento estimación vendrá de fuera de juego)?
Muchas gracias a cualquiera que pueda aclarar esto! Lo siento por un prolijo pregunta, pero quería asegurarme de que me explicó la confusión puntos (muchos ;-)) Brian