Así, en (sin supervisión) texto de modelado, Latente de Dirichlet Asignación (LDA) es un Bayesiano versión Probabilístico de Análisis Semántico Latente (PLSA). Esencialmente, LDA = PLSA + antes de Dirichlet sobre sus parámetros. Mi entendimiento es que la LDA es ahora la referencia y el algoritmo está implementado en varios paquetes, mientras que PLSA no debe ser usado nunca más.
Pero en (supervisado) de categorización de texto, se podría hacer exactamente lo mismo para el Naive Bayes multinomial clasificador y poner una de Dirichlet previo sobre los parámetros. Pero no creo que jamás he visto a nadie hacer eso, y la "estimación" de la versión de Naive Bayes multinomial parece ser la versión implementada en la mayoría de los paquetes. ¿Hay alguna razón para que?