Yo me inclinaría por informar de las estadísticas (incluido el rango) de los 100 pliegues, aunque los resultados de los 10 pliegues no sean independientes. Aunque esto puede no ser del todo válido, es habitual que la gente informe del rango de los resultados de 10 pliegues cuando se hace una repetición de la validación cruzada de 10 pliegues.
La inclusión del intervalo debería contrarrestar en cierta medida el menor IC que probablemente se produzca al tener un mayor número de resultados (no independientes) de los que informar.
Si quisiera ser muy minucioso, podría ajustar un modelo de intercepto aleatorio para cada repetición de los resultados de CV $y_i$ para tener en cuenta la correlación entre los resultados de la CV:
$$ y_i \sim N(\mu_i, \sigma_i) \\ \mu_i \sim N(\mu_0, \tau) $$ donde $\mu_i$ es la media de la repetición CV $i$ y $\mu_0$ es la media global, $\sigma_i$ es la variabilidad de una repetición CV individual, y $\tau$ es la variabilidad de las medias CV entre repeticiones.
Por otra parte, creo que este modelo es excesivo, y el examen de los resultados completos de CV repetidos debería permitirle encontrar el modelo óptimo/más parsimonioso con bastante precisión.