Como se ha señalado, las expectativas simplemente añaden.
Sin embargo, sabiendo que la expectativa no sirve de mucho, también necesitas tener alguna idea de la probable variación alrededor de ella.
Hay tres cosas de las que debes preocuparte:
-
variación en los individuos en torno a su expectativa (una persona con 60% de posibilidades de venir no alcanza realmente su expectativa; siempre está por encima o por debajo de ella)
-
dependencia entre las personas. Las parejas que puedan venir ambos tenderán a asistir ambos o ninguno. Los niños pequeños no asistirán sin sus padres. En algunos casos, algunas personas pueden evitar venir si saben que otra persona estará allí.
-
error en la estimación de las probabilidades. Esas probabilidades son sólo suposiciones; tal vez quieras considerar el efecto de suposiciones algo diferentes (tal vez la evaluación de esas cifras por parte de otra persona)
La primera es susceptible de ser calculada, ya sea por aproximación normal o por simulación. El segundo puede ser simulado bajo varios supuestos, ya sea específicos de las personas, o considerando alguna distribución de las dependencias. (El tercero es más difícil).
Editado para abordar las preguntas de seguimiento en los comentarios:
Si entiendo bien tu frase, para la familia de 4, tienes un 50% de posibilidades de que vengan 4 personas cada uno o ninguna. Ese es un número esperado de 2, ciertamente, pero también querrías tener alguna idea de la variabilidad alrededor de la expectativa, en cuyo caso probablemente quieras mantener la situación real del 50% de 0/50% de 4.
Si se puede dividir a todos en grupos independientes, una buena primera aproximación (con muchos de esos grupos) sería entonces sumar las medias y las variaciones entre los grupos independientes y luego tratar la suma como normal (tal vez con corrección de continuidad). Un enfoque más preciso sería simular el proceso o calcular exactamente la distribución mediante la convolución numérica; aunque ambos enfoques son sencillos, este es un nivel de precisión innecesario para esta aplicación en particular, ya que ya hay muchas capas de aproximación - es como si se dijeran las dimensiones de una habitación al pie más cercano y luego se calculara cuánta pintura se necesita al milímetro más cercano - la precisión adicional es inútil.
Así que imagina (para simplificar) que tenemos cuatro grupos:
1) grupo A (1 individuo) - 70% de probabilidad de asistencia
2) grupo B (1 individuo) - 60% de probabilidad de asistencia
3) grupo C (familia de 4) - 0: 0.5 4: 0.5 (si alguien se queda en casa, nadie vendrá)
4) grupo D (pareja de 2) - 0: 0.4 1: 0.1 2: 0.5 (es decir, 50% de posibilidades de ambos, más 10% de posibilidades de que venga exactamente uno, por ejemplo, si el otro tiene compromisos de trabajo o está enfermo)
Entonces obtenemos las siguientes medias y variaciones:
mean variance
A 0.7 0.21
B 0.6 0.24
C 2.0 4.0
D 1.1 0.89
Tot 4.4 5.34
Así que una aproximación normal será bastante aproximada en este caso, pero sugeriría que más de 7 personas serían bastante improbables (del orden del 5%), y 6 o menos ocurrirían aproximadamente en el 75-80% de las veces.
[Una aproximación más precisa sería simular el proceso, pero en el problema completo en lugar del ejemplo de corte, esto es probablemente innecesario ya que ya hay muchas capas de aproximación].
Una vez que se tenga una distribución combinada que incorpore tales dependencias grupales, se podría entonces aplicar cualquier fuente de dependencia conjunta general (como el clima severo) - o tal vez se desee simplemente asegurarse contra tales eventualidades o incluso ignorarlas, dependiendo de las circunstancias.
43 votos
No veo ninguna cifra para la persona con la que te casas. Esa es la cantidad más importante.
6 votos
Utilicé tu técnica para mi boda y funcionó bien; predijimos unas 80 personas y obtuvimos 85 más o menos. Una vez que tengas a todas esas personas en la hoja de cálculo, también puedes utilizarla para hacer un seguimiento de las personas a las que has enviado notas de agradecimiento, etcétera.
2 votos
Relevante: timharford.com/2013/10/guest-list-angst-a-statistical-approach . Por si sirve de algo, he elegido el enlace al blog personal del autor, pero el artículo es de su columna en el Financial Times.
0 votos
@EricLippert Intenté algo parecido para mi boda pero no tuve tan buen éxito. Hubo una tormenta muy severa el día de y todo el mundo < 30%ish con una hora de viaje o más no se presentó.
3 votos
@NickCox También se olvidaron de los suyos.
0 votos
Un enfoque similar en las noticias, no he mirado en detalle, pero me imagino que fue el enfoque de QuantIbex aquí: bbc.co.uk/noticias/magazine-25980076
0 votos
Yo utilizaría el remuestreo para obtener un número decente de muestras para el número medio de personas y con ello poder obtener un límite superior para la media. De este modo, en mi planificación me situaría dentro del IC del 95% de la media.