20 votos

Para maximizar la posibilidad de adivinar correctamente el resultado de un lanzamiento de moneda, ¿debo elegir siempre el resultado más probable?

Esto no es una tarea. Estoy interesado en entender si mi lógica es correcta con este simple problema de estadísticas.

Digamos que tengo una moneda de 2 caras en la que la probabilidad de que salga cara es $P(H)$ y la probabilidad de voltear una cola es $1-P(H)$ . Supongamos que todas las tiradas tienen probabilidades independientes. Ahora, digamos que quiero maximizar mis posibilidades de predecir si la moneda saldrá cara o cruz en el siguiente lanzamiento. Si $P(H) = 0.5$ Puedo adivinar cara o cruz al azar y la probabilidad de que acierte es $0.5$ .

Ahora, supongamos que $P(H) = 0.2$ Si quiero maximizar mis posibilidades de acertar, ¿debo adivinar siempre las colas cuando la probabilidad es $0.8$ ?

Llevando esto un paso más allá, si tuviera un dado de 3 caras, y la probabilidad de sacar un 1, 2, o, 3 fuera $P(1)=0.1$ , $P(2)=0.5$ y $P(3)=0.4$ ¿Debo adivinar siempre 2 para maximizar mis posibilidades de acertar? ¿Hay algún otro enfoque que me permita adivinar con más precisión?

4 votos

Me parece que está preguntando por la independencia: por ejemplo, si sale cara una vez, ¿es más probable que salga cruz la próxima vez? Si no es esto lo que está preguntando, ¿podría aclarar su pregunta? (Si he entendido bien tu pregunta, la respuesta es "sí": en situaciones como el lanzamiento de una moneda, el resultado más probable será siempre el que tenga la mayor probabilidad, independientemente de lo que haya ocurrido anteriormente).

0 votos

Gracias por la ayuda @arboviral. Sí, estoy asumiendo la independencia. He actualizado la pregunta para indicarlo.

4 votos

Asumiendo la independencia, lo mejor que puedes hacer es elegir el lado con mayor probabilidad. Piénsalo así. No tienes ninguna otra información para hacer una mejor suposición. Todo lo que sabes de los dados es la frecuencia con la que aparece un determinado lado y cuáles fueron los últimos lanzamientos. Pero la independencia te dice que las filas anteriores no tienen efecto en el lanzamiento actual. Tal vez si tuvieras más información, como la cantidad de fuerza utilizada para lanzar los dados, la mano izquierda/derecha del lanzador, o el número de sacudidas anteriores. Sin embargo, si el dado es realmente justo, dudo que incluso ese nivel de detalle proporcione mejores predicciones.

43voto

avid Puntos 161

Tienes razón. Si $P(H) = 0.2$ y estás usando cero-uno pérdida (es decir, necesitas adivinar un resultado real en lugar de una probabilidad o algo así, y además, obtener cara cuando has adivinado cruz es igual de malo que obtener cruz cuando has adivinado cara), deberías adivinar cruz siempre.

La gente suele pensar erróneamente que la respuesta es adivinar cruz en un 80% de las pruebas seleccionadas al azar y cara en el resto. Esta estrategia se denomina " coincidencia de probabilidades " y se ha estudiado ampliamente en la toma de decisiones conductuales. Véase, por ejemplo,

West, R. F., y Stanovich, K. E. (2003). ¿Es inteligente el emparejamiento de probabilidades? Asociaciones entre las elecciones probabilísticas y la capacidad cognitiva. Memoria y Cognición, 31 , 243-251. doi:10.3758/BF03194383

1 votos

+1 para el puntero de la coincidencia de probabilidades. Nunca había oído hablar de eso, aunque estoy seguro de que lo aprovecho a diario como sesgo cognitivo :)

3 votos

(+1) Esto está relacionado con un error común en la interpretación de los modelos de regresión multinomial y similares: la gente puede sorprenderse de que la distribución de las clases predichas no coincida con la distribución de las clases observadas, e incluso buscar formas de "arreglarlo". (Es bueno saber que tiene un nombre).

1 votos

(+1) para el término "coincidencia de probabilidades".

13voto

David Puntos 41

En esencia, estás planteando una pregunta muy interesante: ¿debo predecir utilizando el "MAP Bayesiano" Estimación máxima a posteriori o "Bayesiano real".

Suponga que conoce la verdadera distribución que $P(H)=0.2$ Entonces, utilizando la estimación MAP, supongamos que queremos hacer 100 predicciones sobre los próximos 100 resultados de los volteos. Deberá siempre adivinan que el tirón es la cola NO adivinar $20$ cabeza y $80$ cola. Esto se llama "MAP Bayesiano", básicamente estás haciendo $\arg\max_ \theta f(x|\theta)$ . No es difícil demostrar que de esta manera se puede minimizar el error previsto (pérdida de 0-1). La prueba se puede encontrar en ~la página 53 de Introducción al aprendizaje estadístico .

Existe otra forma de hacerlo, denominada enfoque "bayesiano real". Básicamente, no se trata de "seleccionar el resultado con mayor probabilidad, sino de tener en cuenta todos los casos". Así pues, si alguien le pide que "prediga los próximos 100 resultados", debería negarse a hacerlo, porque cuando se dan 100 resultados binarios, la información probabilística de cada resultado desaparece.

En su lugar, debe preguntarse qué quiere hacer DESPUÉS de conocer los resultados. Supongamos que tendremos alguna función de pérdida (no es necesario que sea de 0 a 1, por ejemplo, la función de pérdida puede ser, si se pierde una cabeza, hay que pagar \$1, but if you miss a tail, you need to pay \$ 5, es decir, pérdida desequilibrada) en su predicción, entonces debe utilizar su conocimiento sobre la verdadera distribución y minimizar la pérdida sobre toda la distribución $$\int \int p(x,y) L(f(x),y) dx dy$$ Es decir, incorporar sus conocimientos sobre la distribución a la pérdida, en lugar de hacerlo por etapas, obteniendo las predicciones y realizando los pasos siguientes.

Además, tiene una muy buena intuición sobre lo que tendrá cuando hay muchos resultados posibles. La estimación MAP no funcionará bien si el número de resultados es grande. Piensa que tienes 100 dados laterales y conoces la verdadera distribución. Donde $P(S_1)=0.1$ y $P(S_2)=P(S_3)=P(S_{100})=0.9/99=0.009090$ . ¿Qué se hace ahora con la estimación máxima a posteriori? Siempre se adivina que se obtiene el primer lado $S_1$ ya que tiene la mayor probabilidad en comparación con los demás. Sin embargo, te equivocarás $90\%$ ¡¡de los tiempos!!

4 votos

El MAP también es bayesiano. Además, usted describe ambos enfoques sin referirse en absoluto al uso de priores, lo que puede inducir a error, ya que está escribiendo sobre métodos bayesianos y los priores son el característica principal de esos métodos.

0 votos

Así que, si alguien te pide que "predigas las próximas 100" vueltas, deberías negarte a hacerlo' Si ese alguien me ofreciera mil millones de euros, si predigo bien, probablemente no los rechazaría. O probablemente te refieres a "predecir" en un sentido diferente al de "intentar adivinar".

0 votos

"cuando se dan 100 resultados binarios, la información probabilística de cada resultado desaparece" Al principio leí esto como "cuando se dan 100 resultados binarios" y no podía entender la frase, pero ahora me di cuenta de que podría significar "cuando dar 100 resultados binarios". ¿Cuál es el correcto, y si es el primero, qué significa?

4voto

noplay Puntos 603

Debido a la independencia, tu valor de expectativa siempre se maximiza si adivinas el caso más probable. No hay una estrategia mejor porque cada lanzamiento de la moneda o del dado no te da ninguna información adicional sobre la moneda o el dado.

Si adivina un resultado menos probable, su expectativa de ganar es menor que si hubiera adivinado el caso más probable, por lo que es mejor que adivine el caso más probable.

Si quisieras hacerlo de manera que tuvieras que cambiar tu estrategia a medida que lanzas una moneda o un dado, podrías considerar una moneda o un dado en el que no conozcas las probabilidades inicialmente y tengas que averiguarlas a medida que las lanzas.

1 votos

Para mí esta respuesta es la explicación más sencilla; si tuvieras que definir una estrategia teniendo en cuenta el resultado que tenías antes, esto rompería las probabilidades "independientes".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X