Gracias por la pregunta personalizada. Creo que nunca he recibido una de esas antes :-)
La respuesta está en esta parte del tutorial enlazado en la pregunta de Martin:
En lugar de elegir la terminación más probable de las asignaciones de monedas que faltan en cada iteración, el algoritmo de maximización de la expectativa calcula las probabilidades para cada terminación posible de los datos que faltan, utilizando los parámetros actuales $\hat\theta(t)$ . Estas probabilidades se utilizan para crear un conjunto de entrenamiento ponderado que consiste en todas las posibles terminaciones de los datos. Por último, una versión modificada de la estimación de máxima verosimilitud que se ocupa de los ejemplos de entrenamiento ponderados proporciona nuevas estimaciones de los parámetros, $\hat\theta(t+1)$ . Al utilizar ejemplos de entrenamiento ponderados en lugar de elegir la mejor terminación única, el algoritmo de maximización de expectativas tiene en cuenta la confianza del modelo en cada terminación de los datos (Fig. 1b).
Así que el $7.2$ colas y $0.8$ las cabezas no deberían sumar $10$ por sí mismos; son contribuciones ponderadas al resultado real $(9,1)$ , ponderado en proporción a las probabilidades de que este resultado se produzca dadas las estimaciones actuales de sesgo. Como hemos calculado que esa proporción es $0.8:0.2$ una contribución de $0.8\cdot(9,1)=(7.2,0.8)$ se añade a la columna de la moneda A y una contribución de $0.2\cdot(9,1)=(1.8,0.2)$ se añade a la columna de la moneda B. Juntos, suman $(9,1)$ (ya que obtuvimos los pesos normalizando su suma a $1$ ). Por lo tanto, cuanto más probable parezca, según las estimaciones de sesgo actuales, que esta fila haya sido producida por la moneda A, más de ella añadiremos a la columna de la moneda A.
Tenga en cuenta que no estamos calculando un valor de expectativa en las columnas; simplemente estamos sumando fracciones de caras y colas en proporción a la probabilidad de que provengan de esta moneda, y al final tomamos la proporción global de caras y colas para obtener una nueva estimación de sesgo; no hay necesidad de que las caras y colas sumen algo o formen un valor de expectativa en cualquiera de las columnas individualmente.
Espero que eso lo aclare; si no es así, puede que tengas que explicar con más detalle por qué crees que esos valores deben sumar $10$ .