37 votos

¡Ayúdame a calcular cuánta gente vendrá a mi boda! ¿Puedo atribuir un porcentaje a cada persona y sumarlos?

Estoy planeando mi boda. Deseo estimar cuanta gente vendrá a mi boda. He creado una lista de personas y la posibilidad de que asistan en porcentaje. Por ejemplo

Dad 100% Mom 100% Bob 50% Marc 10% Jacob 25% Joseph 30%

Tengo una lista de unas 230 personas con porcentajes. ¿Cómo puedo estimar cuántas personas asistirán a mi boda? ¿Puedo simplemente sumar los porcentajes y dividirlo por 100? Por ejemplo, si invito a 10 personas con un 10% de posibilidades de venir cada una, ¿puedo esperar a 1 persona? Si invito a 20 personas con un 50% de posibilidades de venir, ¿puedo esperar 10 personas?

ACTUALIZACIÓN: 140 personas vinieron a mi boda :). Usando las técnicas descritas a continuación predije unas 150. ¡No es tan malo!

43 votos

No veo ninguna cifra para la persona con la que te casas. Esa es la cantidad más importante.

6 votos

Utilicé tu técnica para mi boda y funcionó bien; predijimos unas 80 personas y obtuvimos 85 más o menos. Una vez que tengas a todas esas personas en la hoja de cálculo, también puedes utilizarla para hacer un seguimiento de las personas a las que has enviado notas de agradecimiento, etcétera.

2 votos

Relevante: timharford.com/2013/10/guest-list-angst-a-statistical-approach . Por si sirve de algo, he elegido el enlace al blog personal del autor, pero el artículo es de su columna en el Financial Times.

32voto

Joe Puntos 6

Suponiendo que las decisiones de los invitados de acudir a la boda sean independientes, el número de invitados que acudirán a la boda puede modelizarse como la suma de variables aleatorias de Bernoulli que tienen probabilidades de éxito no necesariamente idénticas. Esto corresponde a la Distribución binomial de Poisson .

Sea $X$ sea una variable aleatoria correspondiente al número total de personas que acudirán a su boda de entre $N$ personas invitadas. El número esperado de participantes es, de hecho, la suma de las probabilidades individuales de ''presentación''. $p_i$ es decir $$ E(X) = \sum_{i = 1}^N p_i . $$ La derivación de los intervalos de confianza no es sencilla dada la forma del función de masa de probabilidad . Sin embargo, son fáciles de aproximar con Montecarlo simulaciones.

La siguiente figura muestra un ejemplo de la distribución del número de participantes en la boda basado en 10000 escenarios simulados (derecha) utilizando algunas probabilidades de aparición falsas para las 230 personas invitadas (izquierda). A continuación se muestra el código R utilizado para ejecutar esta simulación, que proporciona aproximaciones de los intervalos de confianza.

enter image description here

## Parameters
N      <- 230    # Number of potential guests
nb.sim <- 10000  # Number of simulations

## Create example of groups of guests with same show-up probability
set.seed(345)
tmp    <- hist(rbeta(N, 3, 2), breaks = seq(0, 1, length.out = 21))
p      <- tmp$breaks[-1]    # Group show-up probabilities
n      <- tmp$counts        # Number of person per group

## Generate number of guests by group
guest.mat <- matrix(NA, nrow = nb.sim, ncol = length(p))
for (j in 1:length(p)) {
    guest.mat[, j] <- rbinom(nb.sim, n[j], p[j])
}

## Number of guest per scenario
nb.guests <- apply(guest.mat, 1, sum)

## Result summary
par(mfrow = c(1, 2))
barplot(n, names.arg = p, xlab = "Probability group", ylab = "Group size")
hist(nb.guests, breaks = 21, probability =  TRUE, main = "", xlab = "Guests")
par(mfrow = c(1, 1))

## Theoretical mean and variance
c(sum(n * p), sum(n * p * (1-p)))
#[1] 148.8500  43.8475

## Sample mean and variance
c(mean(nb.guests), var(nb.guests))
#[1] 148.86270  43.23657

## Sample quantiles
quantile(nb.guests, probs = c(0.01, 0.05, 0.5, 0.95, 0.99))
#1%     5%    50%    95%    99% 
#133.99 138.00 149.00 160.00 164.00

1 votos

Esto es fantástico. ¿Qué tipo de simulación es exactamente?

4 votos

Se trata de un Montecarlo simulación

0 votos

¿Cómo se transforma "tamaño del grupo" en número de invitados? Tengo una cifra como la suya a la izquierda, pero no sé cómo convertirla en la cifra de la derecha...

18voto

AdamSane Puntos 1825

Como se ha señalado, las expectativas simplemente añaden.

Sin embargo, sabiendo que la expectativa no sirve de mucho, también necesitas tener alguna idea de la probable variación alrededor de ella.

Hay tres cosas de las que debes preocuparte:

  • variación en los individuos en torno a su expectativa (una persona con 60% de posibilidades de venir no alcanza realmente su expectativa; siempre está por encima o por debajo de ella)

  • dependencia entre las personas. Las parejas que puedan venir ambos tenderán a asistir ambos o ninguno. Los niños pequeños no asistirán sin sus padres. En algunos casos, algunas personas pueden evitar venir si saben que otra persona estará allí.

  • error en la estimación de las probabilidades. Esas probabilidades son sólo suposiciones; tal vez quieras considerar el efecto de suposiciones algo diferentes (tal vez la evaluación de esas cifras por parte de otra persona)

La primera es susceptible de ser calculada, ya sea por aproximación normal o por simulación. El segundo puede ser simulado bajo varios supuestos, ya sea específicos de las personas, o considerando alguna distribución de las dependencias. (El tercero es más difícil).


Editado para abordar las preguntas de seguimiento en los comentarios:

Si entiendo bien tu frase, para la familia de 4, tienes un 50% de posibilidades de que vengan 4 personas cada uno o ninguna. Ese es un número esperado de 2, ciertamente, pero también querrías tener alguna idea de la variabilidad alrededor de la expectativa, en cuyo caso probablemente quieras mantener la situación real del 50% de 0/50% de 4.

Si se puede dividir a todos en grupos independientes, una buena primera aproximación (con muchos de esos grupos) sería entonces sumar las medias y las variaciones entre los grupos independientes y luego tratar la suma como normal (tal vez con corrección de continuidad). Un enfoque más preciso sería simular el proceso o calcular exactamente la distribución mediante la convolución numérica; aunque ambos enfoques son sencillos, este es un nivel de precisión innecesario para esta aplicación en particular, ya que ya hay muchas capas de aproximación - es como si se dijeran las dimensiones de una habitación al pie más cercano y luego se calculara cuánta pintura se necesita al milímetro más cercano - la precisión adicional es inútil.

Así que imagina (para simplificar) que tenemos cuatro grupos:

1) grupo A (1 individuo) - 70% de probabilidad de asistencia

2) grupo B (1 individuo) - 60% de probabilidad de asistencia

3) grupo C (familia de 4) - 0: 0.5 4: 0.5 (si alguien se queda en casa, nadie vendrá)

4) grupo D (pareja de 2) - 0: 0.4 1: 0.1 2: 0.5 (es decir, 50% de posibilidades de ambos, más 10% de posibilidades de que venga exactamente uno, por ejemplo, si el otro tiene compromisos de trabajo o está enfermo)

Entonces obtenemos las siguientes medias y variaciones:

      mean   variance
  A    0.7     0.21
  B    0.6     0.24
  C    2.0     4.0
  D    1.1     0.89

 Tot   4.4     5.34

Así que una aproximación normal será bastante aproximada en este caso, pero sugeriría que más de 7 personas serían bastante improbables (del orden del 5%), y 6 o menos ocurrirían aproximadamente en el 75-80% de las veces.

[Una aproximación más precisa sería simular el proceso, pero en el problema completo en lugar del ejemplo de corte, esto es probablemente innecesario ya que ya hay muchas capas de aproximación].


Una vez que se tenga una distribución combinada que incorpore tales dependencias grupales, se podría entonces aplicar cualquier fuente de dependencia conjunta general (como el clima severo) - o tal vez se desee simplemente asegurarse contra tales eventualidades o incluso ignorarlas, dependiendo de las circunstancias.

0 votos

@whuber Buen punto sobre otras fuentes de dependencia, como el clima. En algunas circunstancias, esas cosas pueden anegar fácilmente los efectos que menciono.

0 votos

¿Cómo podría tener en cuenta fácilmente la dependencia? Por ejemplo, si conozco a una pareja con dos hijos y preveo que los padres tienen un 50% de posibilidades de venir. Sé que traerán a sus hijos si vienen. ¿Es seguro atribuir un 50% a cada persona y suponer que vendrán dos?

2 votos

@Behacad: Si sabes que es una cuestión de todo o nada con un grupo determinado, podrías simplemente estimar la probabilidad de que el grupo venga como una sola unidad y ponderar el grupo por el número de individuos que lo componen. Estoy de acuerdo en que también sería bueno incluir márgenes de error en tus estimaciones.

5voto

(Ignora mi comentario anterior al respecto, acabo de darme cuenta de que confundía la expectativa con otra cosa). Dado que esencialmente estás tratando de encontrar la expectativa del número de personas que se presentan, teóricamente puedes sumar la probabilidad de que cada persona se presente.

Esto se debe a que podemos considerar que alguien que se presenta toma o bien el valor $0$ ou $1$ y porque la expectativa es un operador lineal.

Sin embargo, esto sólo nos da el valor esperado; sin más suposiciones, parece difícil estimar cosas como la varianza de las personas que se presentan, sobre todo porque es bastante justo suponer que el hecho de que se presente una persona A no es necesariamente independiente de que se presente una persona B.

Dejando eso a un lado, aquí está un artículo de la BBC vagamente relevante.

4voto

Amy Puntos 6

Para números grandes, el 80% es lo que cabría esperar. Esta puede ser una situación en la que un análisis detallado como el que propones sólo añade errores a los cálculos.
Por ejemplo, ¿la asistencia potencial de Marc es realmente 1/3 de la de Joseph? ¿Y la de José es realmente del 30%, o podría ser del 25%? Suceden cosas cuando llegas a grandes números que simplemente hacen que el 80% sea más válido que todo este análisis. Acabo de volver de una boda. 550 invitados. Asistieron 452. A efectos de planificar el salón y empezar a hablar con el catering, la estimación inicial de 440 estaba bien.

¿Puedo ofrecer una frase de mi brindis a la pareja? "Recuerda, si tu mujer es feliz, pero tú no lo eres, sigues siendo mucho más feliz que si tu mujer es infeliz, pero tú eres feliz".

0 votos

Gracias Una preocupación es que la gente vendrá de todas partes y desde distancias variables. Algunos bastante lejos, otros justo al final de la calle.

3 votos

Esta cifra puede depender de la cultura.

0 votos

@Juho - puede ser. Estoy en los EE.UU. y en mi ejemplo reciente, fue una boda de destino para la mitad de los invitados, es decir, la boda fue en la ciudad natal de la novia. Me pregunto qué diferencias culturales influirían en la participación, pero sospecho que tienes razón.

2voto

willmer Puntos 11

Como estadístico que acaba de casarse, te diré que JoeTaxpayer tiene la respuesta correcta. La cifra del 80% me parece un poco alta, aunque podría ser exacta si la mayoría de la gente es local (la nuestra fue una boda de destino y llegamos más cerca del 65%).

Pero, no obstante, estás asumiendo mucha variabilidad en las probabilidades previas de que la gente asista, creo que más de la que realmente existe. Suponiendo que no invites a gente a la que no le gustes, deberías asumir que casi todo el mundo que esté dentro de sus posibilidades y no tenga ningún conflicto (en sentido amplio) asistirá, pero al menos un 10-20% tendrá algo que le impida asistir. Para los que tienen que viajar, eso aumenta el tiempo y el dinero necesarios, así que calcula que entre el 30 y el 35% de los viajeros no asistirán (dependiendo de la distancia). Por lo demás, mantén las probabilidades constantes (aunque tus padres digan "oh, fulanito no va a volar hasta Austin, sólo queremos invitarle..."). Si el banquete es divertido, sobre todo si hay barra libre, la gente no faltará a menos que sea necesario.

De todos modos, felicidades por casarte. En cuanto a la probabilidad de que sigáis casados, esto siempre es una buena lectura: http://users.nber.org/~bstevens/papers/Estabilidad_marital.pdf

-)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X