Un parámetro óptimo $\theta^*$ es robusto si no cambia mucho cuando se calcula para diferentes muestras de datos de una población.
$\theta^*$ tiene una buena generalizabilidad si su poder predictivo sigue siendo bueno para diferentes muestras de datos de prueba.
Parecen distintas formas de expresar el mismo concepto. ¿Hay alguna sutil diferencia que esté pasando por alto?