Hay pocas cosas que desempacar aquí. El objetivo de las pruebas de permutación es obtener una distribución nula para su estadística de prueba permutando etiquetas y repitiendo el procedimiento muchas veces.
Su estadística de prueba es, por ejemplo, la precisión media, y su procedimiento es CV. Así que debería permutar las etiquetas (todas las etiquetas, porque todas las etiquetas entran en el procedimiento) y luego dividir los datos en pliegues y ejecutar CV.
Si se permuta sólo el conjunto de entrenamiento, entonces no se obtienen nulos válidos, porque no hay aleatoriedad en las etiquetas de los resultados. Si permuta los datos sólo en el conjunto de pruebas, no será válido porque no tendría en cuenta la dependencia entre los pliegues de CV, que es la razón de hacer pruebas de permutación y no sólo una prueba binomial.
Hay algunas advertencias.
Si realiza la división del CV de forma aleatoria, también puede simplemente permutar los datos primero y luego continuar con el CV.
Si su división del CV se realiza de forma que cada pliegue tenga la misma proporción de etiquetas de cada clase o que los pliegues estén equilibrados en función de las mismas otras variables, entonces tiene que permutar de forma que esto también sea así en sus permutaciones. Por lo general, una manera fácil de hacerlo es permutar primero y luego crear sus divisiones equilibradas.
Si no tiene pliegues aleatorios, sino que ya están dados, por ejemplo, cada pliegue son datos de diferentes ciudades, o diferentes hospitales, o diferentes dispositivos de medición, entonces tiene que permutar dentro de estos pliegues para que las etiquetas del mismo hospital no se permuten con las etiquetas de un hospital diferente.
Es posible que tenga otros "bloques de intercambiabilidad" que no se basen en pliegues, por ejemplo, si tiene diferentes hospitales, pero no divide sus datos por hospitales, entonces debe permutar sus datos dentro de estos bloques, pero no necesariamente dentro de los pliegues.