31 votos

Pregunta de Facebook (Ciencia de datos)

Por curiosidad, aquí hay una pregunta de Glassdoor (Entrevista de Ciencia de Datos de Facebook)

Estás a punto de tomar un avión a Seattle. Quieres saber si deberías llevar un paraguas. Llamas a 3 amigos tuyos que viven allí al azar y les preguntas independientemente si está lloviendo. Cada uno de tus amigos tiene una probabilidad de 2/3 de decirte la verdad y una probabilidad de 1/3 de molestarte mintiendo. Los 3 amigos te dicen que "Sí" está lloviendo. ¿Cuál es la probabilidad de que realmente esté lloviendo en Seattle?

Usando un análisis bayesiano, es bastante claro que no puedes resolver esto sin la probabilidad previa de que esté lloviendo en Seattle.

Sin embargo, aquí hay un enfoque diferente que encontré interesante en la discusión contenida en Glassdoor.

Dado que los tres amigos dijeron "Sí", la pregunta básicamente se reduce a cuál es la probabilidad de que los tres amigos estén diciendo la verdad dado que los tres amigos dijeron "Sí". Dado que les preguntas a los tres amigos independientemente, la probabilidad de que los tres amigos estén diciendo la verdad se da por (2/3)(2/3)(2/3) = 8/27. Por lo tanto, la probabilidad de que esté lloviendo es 8/27.

Aunque esto es quizás un tanto convincente, no estoy seguro de si es correcto. ¿Alguien tiene alguna idea?

¡Gracias!

6 votos

Una estimación para la probabilidad previa de lluvia se puede encontrar simplemente buscando en Google 'número de días lluviosos en Seattle', lo que muestra que aproximadamente 150 días del año tienen lluvia, por lo que un número razonable para usar es $p_{\rm rain} \approx 0.4$.

0 votos

La pregunta está incompleta :)

24voto

d.k.o. Puntos 4022

Para expresarlo de forma un poco más formal... Sea $p_r$ la probabilidad previa de lluvia ($p_n\equiv 1-p_r$). Entonces, la probabilidad de lluvia dado 3 respuestas "sí" $\{y,y,y\}$ es

$$ \mathsf{P}(\text{lluvia}\mid \{y,y,y\})=\frac{\mathsf{P}(\text{lluvia}\cap\{y,y,y\})}{\mathsf{P}(\{y,y,y\})} \\ =\frac{\mathsf{P}(\{y,y,y\}\mid\text{lluvia})\cdot p_r}{\mathsf{P}(\{y,y,y\}\mid\text{lluvia})\cdot p_r+\mathsf{P}(\{y,y,y\}\mid\text{no lluvia})\cdot p_n} $$

Luego, si asumimos la independencia condicional de las respuestas de los amigos, la última fórmula se convierte en

$$ =\frac{(2/3)^3\cdot p_r}{(2/3)^3\cdot p_r+(1/3)^3\cdot p_n}=\frac{p_r}{p_r+ p_n/8}. $$

14voto

Don Hallsten Puntos 11

Cada uno de los análisis anteriores falla al evaluar la lógica de la pregunta principalmente en su enfoque. Dado que los tres dicen que está lloviendo, no puedes abordar la solución determinando la propensión de cada amigo a decir la verdad. Para que no esté lloviendo, TODOS deben estar mintiendo. Por lo tanto, la solución debe ser la inversa de la probabilidad de que los tres te estén "engañando". (1/3)x(1/3)x(1/3)=1/27 (3.7% de probabilidad de que estén mintiendo). Dado que solo hay un 3.7% de probabilidad de que los tres amigos te estén engañando, hay un 96.3% de probabilidad de que esté lloviendo.

1 votos

Este es el enfoque correcto. Tomar un enfoque bayesiano probablemente sea apropiado en un sentido realista, pero si el entrevistador te dice que no tienes la capacidad de determinar las probabilidades a priori, no puedes usar Bayesiano. Señal adicional solo debería mejorar tu fidelidad, así que no necesitas que todos los amigos estén correctos. Puedes llegar a la misma respuesta de manera más torpe al calcular la probabilidad de que al menos un amigo esté correcto. P(A o B o C) = P(P(A o B) o C) = (2/3 + 2/3 - (2/3)*(2/3)) + 2/3 - (2/3 + 2/3 - (2/3)*(2/3))*(2/3) = 96.3

7voto

Tu aritmética está equivocada, pero ese no es el peor problema con tu método.

¿Aplicarías la misma lógica si la pregunta fuera "hay dos lunas azules en el cielo"?

0 votos

Este es más un comentario que una respuesta. Aun así, me gusta.

7voto

user411037 Puntos 51

** Editado **

Suponiendo que la posibilidad anterior de lluvia en cualquier día es de 0.25, P(lluvia dado que los tres dicen sí) se puede calcular utilizando el teorema de Bayes

es decir, P(R|YYY) = P(R)*P(YYY|R)/P(YYY)

P(YYY) = todos dicen la verdad cuando llueve + todos mienten cuando no llueve = 0.25 * (2/3)^3 + 0.75 * (1/3)^3

P(R|YYY) = 0.25 * (2/3)^3 / (0.25 * (2/3)^3 + 0.75 * (1/3)^3) = 8 / (8 + 3) = 8/11

2voto

Lucas K. Puntos 111

Estás completamente en lo correcto acerca del análisis bayesiano. Es correcto decir que la probabilidad es 8/27 (no 8/9) de que todos digan la verdad, antes del experimento. Sin embargo, después del experimento, tienes tres respuestas. Si en la zona es poco probable que llueva (por ejemplo, en el desierto), las tres respuestas de 'sí' son prueba de dos cosas: a) podría estar lloviendo en realidad b) están mintiendo.

Entonces, después del experimento, la probabilidad no es 8/27 de que estén diciendo la verdad, porque las respuestas que dan son prueba de su honestidad.

Hay algunos trucos de cálculo que no mucha gente conoce. El 2/3 se puede ver como un cambio de probabilidad previa de 1/2 a 2/3, incluso si la probabilidad previa no es 1/2. Ahora, si tomas el "Odd", que es $p / (1-p)$, entonces simplemente puedes multiplicarlos. $Odd(2/3) = 2$. Si tu probabilidad previa es $1/10$, entonces el $Odd(1/10) = 1/9$. Por tres veces sí, lo multiplicas por 2 tres veces. Obtienes 8/9. De vuelta a la probabilidad normal, obtienes $8/17$.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X