31 votos

Pregunta de Facebook (Ciencia de datos)

Por curiosidad, aquí hay una pregunta de Glassdoor (Entrevista de Ciencia de Datos de Facebook)

Estás a punto de tomar un avión a Seattle. Quieres saber si deberías llevar un paraguas. Llamas a 3 amigos tuyos que viven allí al azar y les preguntas independientemente si está lloviendo. Cada uno de tus amigos tiene una probabilidad de 2/3 de decirte la verdad y una probabilidad de 1/3 de molestarte mintiendo. Los 3 amigos te dicen que "Sí" está lloviendo. ¿Cuál es la probabilidad de que realmente esté lloviendo en Seattle?

Usando un análisis bayesiano, es bastante claro que no puedes resolver esto sin la probabilidad previa de que esté lloviendo en Seattle.

Sin embargo, aquí hay un enfoque diferente que encontré interesante en la discusión contenida en Glassdoor.

Dado que los tres amigos dijeron "Sí", la pregunta básicamente se reduce a cuál es la probabilidad de que los tres amigos estén diciendo la verdad dado que los tres amigos dijeron "Sí". Dado que les preguntas a los tres amigos independientemente, la probabilidad de que los tres amigos estén diciendo la verdad se da por (2/3)(2/3)(2/3) = 8/27. Por lo tanto, la probabilidad de que esté lloviendo es 8/27.

Aunque esto es quizás un tanto convincente, no estoy seguro de si es correcto. ¿Alguien tiene alguna idea?

¡Gracias!

6 votos

Una estimación para la probabilidad previa de lluvia se puede encontrar simplemente buscando en Google 'número de días lluviosos en Seattle', lo que muestra que aproximadamente 150 días del año tienen lluvia, por lo que un número razonable para usar es $p_{\rm rain} \approx 0.4$.

0 votos

La pregunta está incompleta :)

2voto

Chai Puntos 46

D.k.o. proporcionó una respuesta detallada sobre cómo hacer el análisis bayesiano. Intentaré dar una intuición para la segunda parte de tu pregunta:

Dado que los tres amigos dijeron "Sí", la pregunta básicamente se reduce a cuál es la probabilidad de que los tres amigos estén diciendo la verdad dado que los tres amigos dijeron "Sí". Dado que preguntas a los tres amigos independientemente, la probabilidad de que los tres amigos estén diciendo la verdad se calcula como (2/3)(2/3)(2/3) = 8/27. Por lo tanto, la probabilidad de que esté lloviendo es 8/27.

Aunque esto es quizás un poco convincente, no estoy seguro de si es correcto. ¿Alguien tiene alguna idea?

Este enfoque es incorrecto, precisamente porque no tiene en cuenta la probabilidad a priori de lluvia en Seattle. Para ver que la probabilidad de lluvia en Seattle es importante, simplemente reformula la pregunta un poco: - ¿Qué pasaría si esta pregunta se hiciera sobre una ubicación imaginaria en la que nunca llueve? - ¿O qué pasa si fuera sobre una ubicación en la que siempre llueve? El enfoque que describes claramente falla en ambos casos: en el primer caso, tus amigos deben estar mintiendo, y en el segundo, deben estar diciendo la verdad.

El análisis bayesiano funciona en estos "casos extremos": en la notación de d.k.o., si $p_r = 1$, entonces $\mathsf{P}(\text{lluvia}\mid \{y,y,y\}) =1$, y de manera similar, si $p_r = 0$, entonces $\mathsf{P}(\text{lluvia}\mid \{y,y,y\}) =0$.

(Sospecho que Robert Israel estaba tratando de hacer un punto similar sobre lo que pasa si la probabilidad previa del evento sobre el que tus amigos están informando es $0$.)

1voto

Tony Puntos 11

No importa si está lloviendo o no, la posibilidad de que $3$ amigos tomen la misma acción es $111$ y $000$ de $6$ permutaciones que siempre va a ser $1/3.$
O puedes hacer $(2/3)^3 + (1/3)^3 = 1/3\;$ lo cual tiene más sentido para la pregunta, ya que o todos mienten o todos dicen la verdad. Por lo tanto, la posibilidad base del problema es $\;1/3.\;$ La probabilidad de que llueva y que $3$ amigos hablen la verdad es $(2/3)^3 = 8/27.\;$ Por lo tanto, $p$ de que llueva es $(8/27) / (1/3) = 8/9$

0voto

Sinha Puntos 1

Aquí está mi opinión sobre este problema:

O todas las 3 están diciendo la verdad, o todas ellas están mintiendo. Lo que hace que las probabilidades sean de 2/3 y 1/3 respectivamente.

Entonces, la probabilidad de lluvia es o Evento: Lluvia y Verdad, o Evento: Sin lluvia y Mentira.

Vamos a suponer que las posibilidades previas de lluvia en Seattle es del 25%.

En ese caso, P(Lluvia | Y Y Y) = (0.25 * 2/3) / (0.25 * 2/3) + (0.75 * 1/3) = 0.4

Por lo tanto, la probabilidad de que realmente llueva en Seattle sería del 40%

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X