33 votos

problema de cumpleaños - número esperado de colisiones

Hay muchas descripciones del "problema del cumpleaños" en este sitio - el problema de encontrar la probabilidad de que en un grupo de nn personas habrá alguna (= al menos 2) que comparta un cumpleaños.

Me pregunto cómo encontrar en cambio el número esperado de personas que comparten un cumpleaños en un grupo de nn personas. Recuerdo que la expectativa significa la suma ponderada de las probabilidades de cada resultado:

E[X]=n1i=0xipiE[X]=n1i=0xipi

Y aquí xx debe significar el número de colisiones que implican i+1i+1 personas, que es (ni)(ni) . Todo nn personas nacidas en días diferentes significa que no hay colisiones, i=0i=0 dos personas nacidas el mismo día significa nn colisiones, i=1i=1 Todos nn personas nacidas el mismo día significa nn colisiones, i=n1i=n1 .

Dado que las probabilidades de que haya tres o más personas con la misma fecha de nacimiento son muy pequeñas en comparación con las de dos personas con la misma fecha de nacimiento, y disminuyen más rápidamente que xx aumenta, ¿es correcto decir que esta expectativa puede ser aproximada por

E[X](n0)pno collisions+(n1)pone collisionE[X](n0)pno collisions+(n1)pone collision

Esto no me parece bien y agradecería alguna orientación.


Lo siento - editado para cambiar (n1)(n1) a (n0)(n0) en la segunda ecuación. Es un descuido por mi parte.

0 votos

Que haya una colisión de cinco personas no significa que no haya también una colisión de otras tres personas, ¿se cuenta esto con 8? con 5? Además, ¿cómo se evita contar la colisión de cuatro personas entre las cinco personas por segunda vez? En otras palabras, defina pipi , explique lo que realmente quiere contar y luego trate de justificar su fórmula para la expectativa.

0 votos

@user9325: Yo diría que una colisión con 5 personas debería significar con exactamente 5 personas; una colisión con 3 personas tendría una probabilidad diferente y se contaría como un término diferente.

4 votos

De nuevo, tienes 3 personas que cumplen años el 1 de mayo, 5 personas que cumplen años el 20 de septiembre y 1 persona más. ¿Cuál es el valor de X en este caso? 3,5,8, 30 ? Ten en cuenta que el término 30 viene de contar todo "colisiones" número de 2-colisiones, 3-colisiones, etc. Por lo tanto, no debería decirme que algo "aporta otro término", primero debería decirme qué quiere para contar.

46voto

Nikolai Prokoschenko Puntos 2507

La persona de probabilidades BB acciones persona AA es el cumpleaños de 1/N1/N , donde NN es el número de cumpleaños igualmente posibles,

por lo que la probabilidad BB no comparte la persona AA es el cumpleaños de 11/N11/N ,

por lo que la probabilidad n1n1 otras personas no comparten AA es el cumpleaños de (11/N)n1(11/N)n1 ,

por lo que el número esperado de personas que no tienen otras que compartan su cumpleaños es n(11/N)n1n(11/N)n1 ,

por lo que el número esperado de personas que comparten cumpleaños con alguien es n(1(11/N)n1)n(1(11/N)n1) .

2 votos

Hermoso en su claridad. Gracias.

1 votos

Escribí una simulación y realicé varios millones de ensayos utilizando varios N y n; los resultados están dentro de 0,001n de lo que predice su fórmula. Gracias de nuevo.

0 votos

Me gustaría poder citar su ayuda en el trabajo que estoy escribiendo (sobre filología, no sobre cumpleaños). ¿Te importaría buscarme en brannerchinese.com y contactar conmigo fuera de la lista? En el sitio de SE no hay una función de mensajería privada normal ( meta.math.stackexchange.com/q/632/9263 ) y no veo otro medio no público para pedirle un nombre con el que pueda agradecer su ayuda. Comprendo si prefieres permanecer en el anonimato o "Henry".

20voto

Oli Puntos 89

Intentaré controlar la interpretación más estándar de nuestra pregunta utilizando (al principio) un lenguaje muy informal. Llamemos a alguien infeliz si una o más personas comparten su "cumpleaños". Queremos encontrar el "número esperado" de personas infelices.

Definir la variable aleatoria XX diciendo que XX es el número de personas infelices. Queremos encontrar E(X)E(X) . Sea pipi sea la probabilidad de que X=iX=i . Entonces E(X)=ni=0ipiE(X)=ni=0ipi Ese es más o menos el enfoque que usted adoptó. Ese enfoque es correcto, y algo muy razonable para intentar. De hecho han sido entrenado para utilizar este enfoque, ya que es exactamente como resolvió los ejercicios que siguieron a la definición de la expectativa.

Por desgracia, en este problema, encontrar el pipi es muy difícil. Uno podría, como usted, decidir que para una buena aproximación, sólo los primeros pipi realmente importa. Eso es a veces cierto, pero depende bastante de los valores NN de "días en el año" y el número nn de personas.

Afortunadamente, en este problema, y en muchos otros similares, existe una alternativa muy enfoque eficaz. Implica un poco de teoría, pero la recompensa es considerable.

Alinea a las personas en una fila. Define las variables aleatorias U1,U2,U3,,UnU1,U2,U3,,Un diciendo que Uk=1Uk=1 si el kk -la persona es infeliz, y Uk=0Uk=0 si el kk -la persona no es infeliz. La observación crucial es que X=U1+U2+U3++UnX=U1+U2+U3++Un

Una forma de interpretarlo es que tú, el observador, recorres la fila de personas, marcando con una cruz en tu hoja de cálculo si la persona está descontenta, y no marcando nada si la persona no está descontenta. El número de marcas es XX el número de personas infelices. También es la suma de los UkUk .

A continuación utilizamos el siguiente teorema muy importante: La expectativa de una suma es la suma de las expectativas . Este teorema se cumple "siempre". Las variables aleatorias que se suman no tienen por qué ser independientes . En nuestra situación, el UkUk no son independientes, pero, para la expectativa de una suma, eso no importa. Así que tenemos E(X)=E(U1)+E(U2)+E(U3)++E(Un)E(X)=E(U1)+E(U2)+E(U3)++E(Un)

Por último, hay que tener en cuenta que la probabilidad de que Uk=1Uk=1 es, como explica cuidadosamente @Henry, igual a pp , donde p=1(11/N)n1p=1(11/N)n1 De ello se desprende que E(Uk)=pE(Uk)=p para cualquier kk y por lo tanto E(X)=npE(X)=np .

0 votos

@user6312, ¿algún consejo para encontrar la probabilidad de que k personas compartan el mismo cumpleaños?

1 votos

@usuario6312: Agradezco esta paciente contextualización de la respuesta de @Henry.

0 votos

Este es el enfoque que el profesor espera ver en el examen. Gracias.

7voto

Mike Powell Puntos 2913

La siguiente aproximación puede ser útil.

Si hay kk personas y NN los posibles cumpleaños (o en el caso de una tabla hash, kk los elementos que se han convertido en hash en NN cubos), entonces el número esperado de personas/objetos que colisionan con al menos uno de los otros es exactamente (ver la respuesta de Henry o la de André Nicolas) k(1(11N)k1)=k(k1)Nk(k1)(k2)2N2+O(1N3)k2N.


La anterior es una posible definición de "número esperado de colisiones". Si hay r cumpleaños/cubos cada uno con dos personas/artículos en ellos, la expresión anterior da cuenta 2r ya que cuenta cada miembro de cada par. Si en cambio se quiere contar el número de cubos/cumpleaños que tienen varias personas en ellos, entonces la respuesta es aproximadamente k22N.

Este resultado puede derivarse

  • del análisis anterior, observando que, en primer orden, el tipo de colisión más común es tener 2 en un cubo (las colisiones a tres bandas y superiores serán estadísticamente raras), por lo que sólo hay que reducir el recuento a la mitad;

  • o bien, haciendo un análisis similar centrado en los cumpleaños/cubos: la probabilidad de que 0 o 1 de la k la gente tiene ese cumpleaños en particular es (11N)k+k1N(11N)k1 Por lo tanto, el número esperado de cubos con múltiples valores en ellos es N(1(11N)kk1N(11N)k1)=k(k1)2Nk(k1)(k2)3N2+O(1N3)k22N.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X