13 votos

cómo funciona la maximización de la expectativa en el problema de lanzar una moneda

Joriki:

Gracias por su respuesta sobre el trabajo de maximización de expectativas relacionado con el problema de lanzar una moneda ( ¿cómo funciona la maximización de las expectativas? ).

Ha explicado cómo se selecciona la probabilidad de la moneda A o la moneda B para cada conjunto de observaciones.

Por ejemplo, nos ha dicho cómo derivar el 0,8,0,2 dadas las estimaciones de sesgo actuales A=0,6 y B=0,5 en la segunda fila.

Puedes ayudarme a entender cómo pasamos de esa distribución de probabilidad (0,8, 0,2) a la expectativa (7,2H, 0,8T) para la moneda A en la 2ª fila también. Al igual que la pregunta formulada por Martin, el número total de lanzamientos debería ser 10 en lugar de 7,2H + 0,8T = 8?

Muchas gracias aquí.

19voto

JiminyCricket Puntos 143

Gracias por la pregunta personalizada. Creo que nunca he recibido una de esas antes :-)

La respuesta está en esta parte del tutorial enlazado en la pregunta de Martin:

En lugar de elegir la terminación más probable de las asignaciones de monedas que faltan en cada iteración, el algoritmo de maximización de la expectativa calcula las probabilidades para cada terminación posible de los datos que faltan, utilizando los parámetros actuales $\hat\theta(t)$ . Estas probabilidades se utilizan para crear un conjunto de entrenamiento ponderado que consiste en todas las posibles terminaciones de los datos. Por último, una versión modificada de la estimación de máxima verosimilitud que se ocupa de los ejemplos de entrenamiento ponderados proporciona nuevas estimaciones de los parámetros, $\hat\theta(t+1)$ . Al utilizar ejemplos de entrenamiento ponderados en lugar de elegir la mejor terminación única, el algoritmo de maximización de expectativas tiene en cuenta la confianza del modelo en cada terminación de los datos (Fig. 1b).

Así que el $7.2$ colas y $0.8$ las cabezas no deberían sumar $10$ por sí mismos; son contribuciones ponderadas al resultado real $(9,1)$ , ponderado en proporción a las probabilidades de que este resultado se produzca dadas las estimaciones actuales de sesgo. Como hemos calculado que esa proporción es $0.8:0.2$ una contribución de $0.8\cdot(9,1)=(7.2,0.8)$ se añade a la columna de la moneda A y una contribución de $0.2\cdot(9,1)=(1.8,0.2)$ se añade a la columna de la moneda B. Juntos, suman $(9,1)$ (ya que obtuvimos los pesos normalizando su suma a $1$ ). Por lo tanto, cuanto más probable parezca, según las estimaciones de sesgo actuales, que esta fila haya sido producida por la moneda A, más de ella añadiremos a la columna de la moneda A.

Tenga en cuenta que no estamos calculando un valor de expectativa en las columnas; simplemente estamos sumando fracciones de caras y colas en proporción a la probabilidad de que provengan de esta moneda, y al final tomamos la proporción global de caras y colas para obtener una nueva estimación de sesgo; no hay necesidad de que las caras y colas sumen algo o formen un valor de expectativa en cualquiera de las columnas individualmente.

Espero que eso lo aclare; si no es así, puede que tengas que explicar con más detalle por qué crees que esos valores deben sumar $10$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X