21 votos

Varianza de información de la validación cruzada k-fold repetida

He estado utilizando la validación cruzada k-fold repetida y he estado informando de la media (de la métrica de evaluación, por ejemplo, sensibilidad, especificidad) calculada como la media general a través de los pliegues de diferentes ejecuciones de la validación cruzada.

Sin embargo, no estoy seguro de cómo debo informar de la desviación. He encontrado aquí muchas preguntas que tratan sobre la validación cruzada repetida, sin embargo, ninguna que yo conozca responde explícitamente a la cuestión de la varianza en las pruebas de validación cruzada repetida.

Entiendo que la desviación total se debe a: 1) inestabilidad del modelo y 2) tamaño limitado de la muestra.

Parece que hay 4 enfoques diferentes para calcular la varianza para la validación cruzada k-fold repetida:

1) ¿la varianza de la métrica de rendimiento media estimada (por ejemplo, la precisión) en todas las ejecuciones de la validación cruzada es una estimación válida de la varianza?

2) la varianza agrupada mediante la agrupación de varianzas específicas de ejecución (que se calculan a través de diferentes pliegues de una ejecución de prueba de validación cruzada).

3) concatenar los resultados de clasificación de diferentes pliegues de una validación cruzada ejecutada en un gran vector. Por ejemplo, si el número de datos de prueba en cada pliegue es 10 y tengo una CV de 10 pliegues, el vector resultante para una repetición será de tamaño 100. Ahora bien, si repito mi prueba de validación cruzada 10 veces, tendré 10 vectores de tamaño 100, cada uno de los cuales contendrá los resultados de clasificación de una ejecución de CV de 10 pliegues. Ahora, calcularía la media y la varianza como en el caso de una única ejecución de CV.

4) También he leído en (ecuaciones 2 y 3 en 1 ) que la varianza es la suma de la varianza externa y la varianza interna esperada. Si he entendido bien, la varianza externa es la varianza de los rendimientos medios específicos de cada repetición, y la varianza interna es la varianza entre los distintos pliegues de una serie de validación cruzada.

Agradecería enormemente su ayuda y orientación sobre qué varianza sería la adecuada para informar de la prueba de validación cruzada repetida.

Gracias,

4voto

1 y 3 me parecen inválidos, ya que no tienen en cuenta las dependencias entre ejecuciones repetidas. En otras palabras, las ejecuciones k-fold repetidas son más parecidas entre sí que las repeticiones reales del experimento con datos independientes.

2 no tiene en cuenta las dependencias entre pliegues dentro de la misma ejecución.

No sé si el 4.

Una referencia potencialmente relevante (y desalentadora) es Bengio & Grandvalet, 2004, "Ningún estimador insesgado de la varianza de K-Fold Cross-Validation"

0voto

Tyler Durden Puntos 13

Puede que me equivoque (¡y estoy abierto a cambiar de opinión!), pero a mi entender, cuando decimos que el CV reduce la varianza, en realidad no podemos verlo observando la varianza a través de los pliegues.

Lo que ocurre es que CV es sólo una técnica que mejora la estimación del rendimiento de un modelo (¡uno!) (ya que en los pliegues k entrenamos a los mismo modelo, simplemente con datos diferentes). Por lo tanto, una ronda de CV nos da simplemente un (la media de los pliegues) y no podemos decir nada sobre la varianza.

Por lo que he entendido, podemos introducir varianza si hacemos más experimentos. Por ejemplo, consideremos la repetición de 10 experimentos: en cada experimento ejecutamos un k-fold-CV y terminamos con la estimación final de, digamos, la precisión. En última instancia, esto nos da 10 valores diferentes de precisión. Ahora podemos calcular la varianza de estos 10 valores y llamarla $\sigma^2_k$ . Personalmente, yo informaría de este valor. Obsérvese que podemos hacer lo mismo para el escenario inicial sin CV. Sólo hay que calcular la métrica final para 10 experimentos en los que se hace simplemente un reparto 70-30 o 60-40.

Ahora podemos hacer lo mismo para otros valores de k y podemos ver cómo esto $\sigma^2$ disminuye para k=5 o k=10 con respecto al caso más sencillo sin CV.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X