Su \$I_{CE}\$ = \$I_{BE} \times h_{FE}\$ no es del todo correcto. Esta ecuación muestra lo que la corriente de colector podría si se le da suficiente tensión de colector. La saturación se produce cuando no se le da suficiente tensión. Por lo tanto, en saturación, \$I_{CE} \lt I_{BE} \times h_{FE}\$ . O puedes verlo al revés, es decir, que estás suministrando más corriente de base de la necesaria para manejar toda la corriente de colector que puede suministrar el circuito. Dicho matemáticamente, esto es \$I_{BE} \gt I_{CE} \mathbin{/} h_{FE}\$ .
Como el colector de un NPN actuará como un sumidero de corriente y en saturación el circuito externo no le está dando tanta corriente como podría pasar, el voltaje del colector bajará tanto como pueda. Un transistor saturado suele tener unos 200mV C-E, pero eso también puede variar mucho según el diseño del transistor y la corriente.
Un efecto de la saturación es que el transistor tarda en apagarse. Hay cargas adicionales "no utilizadas" en la base que tardan un poco en drenarse. Esto no es muy científico y sólo describe a grandes rasgos la física de los semiconductores, pero es un modelo suficientemente bueno para tenerlo en mente como explicación de primer orden.
Una cosa interesante es que el colector de un transistor saturado está realmente por debajo de la tensión de base. Esto se aprovecha en la lógica Schottky. Un diodo Schottky está integrado en el transistor desde la base hasta el colector. Cuando el colector baja cuando está casi en saturación, roba corriente de base que mantiene el transistor justo al borde de la saturación. El voltaje de encendido será un poco más alto ya que el transistor no está completamente saturado. La ventaja es que hace que la transición de apagado sea más rápida, ya que el transistor está en la región "lineal" en lugar de en saturación.