En primer lugar, me di cuenta de que si necesito realizar predicciones binarias, tengo que crear al menos dos clases mediante la realización de una codificación de un solo golpe. ¿Es esto correcto? Sin embargo, ¿la entropía cruzada binaria es sólo para predicciones con una sola clase? Si utilizara una pérdida de entropía cruzada categórica, que suele encontrarse en la mayoría de las bibliotecas (como TensorFlow), ¿habría una diferencia significativa?
De hecho, ¿cuáles son las diferencias exactas entre una entropía cruzada categórica y una binaria? Nunca he visto una implementación de la entropía cruzada binaria en TensorFlow, así que pensé que quizás la categórica funciona igual de bien.