Tratando de responder al comentario de Xi'an, para comprobar si estoy entendiendo su comentario. Por lo que estoy entendiendo él quiere decir que la actualización ππ a la variable aleatoria tendría el significado de modelar nuestra incertidumbre de ππ pero no el proceso de muestreo de los puntos de datos. Trato de escribir esto mejor para el ejercicio.
En la configuración estándar, cuando ajustamos una mezcla gaussiana el ππ son parámetros. Supongamos que μμ y σσ fijada aquí y supongamos que tenemos MM muestras. En la configuración habitual, el algoritmo EM encuentra la estimación de máxima probabilidad:
πMLE=argmaxπ logL(x|π)πMLE=argmaxπ logL(x|π)
Ahora, en lugar de tratar ππ como parámetro podemos convertirlo en una variable aleatoria. Para ello necesitamos definir su distribución de probabilidad y su relación con xx . En términos matemáticos necesitamos:
Para ello introducimos un parámetro αα que define la prioridad como una distribución Dirchlet y llegar al modelo gráfico:
![enter image description here]()
que define completamente la articulación P(x,π|α)P(x,π|α) .
¿Qué hemos perdido/ganado con respecto a la MLE?
-
Aún así, todos los valores de ππ son posibles/se tienen en cuenta. Si condicionamos el valor de ππ tenemos P(x|π,α)=P(x|π)P(x|π,α)=P(x|π) . Esta es exactamente la probabilidad paramétrica que teníamos antes ;
-
Aún así podemos hacer inferencia del valor de ππ mediante la estimación de la posterior P(π|x,α)P(π|x,α) ;
-
Como inconveniente, hemos introducido un parámetro αα que no estaba presente antes. Tal vez tendría algún sentido estimar αα maximizando la probabilidad marginal:
S(α)=∫dπP(π|α)P(x|π)S(α)=∫dπP(π|α)P(x|π)
aunque este enfoque parece suponer que la incertidumbre en ππ está relacionado con el proceso de muestreo de xx . Tengo la impresión de que de esta manera mezclaríamos "incertidumbres" y "probabilidades de muestreo", pero quizás estos conceptos están tan interrelacionados que se pueden mezclar.
En realidad este enfoque ("máxima probabilidad marginal") en cierto sentido está haciendo que el ππ las variables desaparecen de la forma descrita en el mensaje original (raro...)