Contexto
La gaussiana multivariante aparece con frecuencia en el aprendizaje automático y los siguientes resultados se utilizan en muchos libros y cursos de ML sin las derivaciones.
Datos dados en forma de matriz XX de las dimensiones m×pm×p si suponemos que los datos siguen una pp -variante gaussiana con parámetros media μμ ( p×1p×1 ) y matriz de covarianza ΣΣ ( p×pp×p ) el Máxima verosimilitud Estimadores están dadas por:
- ˆμ=1m∑mi=1x(i)=ˉx
- ˆΣ=1m∑mi=1(x(i)−ˆμ)(x(i)−ˆμ)T
Entiendo que el conocimiento de la gaussiana multivariante es un requisito previo para muchos cursos de ML, pero sería útil tener la derivación completa en una respuesta autocontenida de una vez por todas, ya que creo que muchos autodidactas están rebotando por los sitios web stats.stackexchange y math.stackexchange en busca de respuestas.
Pregunta
¿Cuál es la derivación completa de los estimadores de máxima verosimilitud para la gaussiana multivariante
Ejemplos:
Estos notas de clase (página 11) sobre el Análisis Discriminante Lineal, o estos hacer uso de los resultados y asumir los conocimientos previos.
También hay algunos puestos que están parcialmente contestados o cerrados: