En varios lugares dispersos en línea y en StackExchange he leído que el remuestreo bootstrap es más apropiado para calcular los intervalos de confianza, mientras que el remuestreo por permutación es más apropiado para las pruebas de hipótesis, pero por qué es así (o es incorrecta esta generalización) ?
He visto que esto se debe a que el remuestreo bootstrap estima la población real en lugar de la distribución bajo la nula, pero me parece que si el cálculo del intervalo de confianza es válido, la comprobación de la hipótesis también es apropiada a través de ver si el valor de la hipótesis nula se encuentra dentro del intervalo. Además, podemos emular la distribución nula en el bootstrapping desplazando nuestras medias (restando las medias de la muestra y volviendo a añadir la media bajo la hipótesis nula).