¿Cuáles son las ventajas de dar ciertos valores iniciales a las probabilidades de transición en un modelo de Markov oculto? Al final, el sistema los aprenderá, así que ¿qué sentido tiene dar valores distintos a los aleatorios? ¿Influye el algoritmo subyacente, como el de Baum-Welch?
Si conozco las probabilidades de transición al principio con mucha precisión, y mi objetivo principal es predecir las probabilidades de salida del estado oculto a las observaciones, ¿qué me aconsejarías?