7 votos

En la vida Real la paradoja de cumpleaños.

Esta pregunta está inspirada en la paradoja de Cumpleaños.

Supongamos que tenemos un espacio muestral $S$ $n$ elementos. Hay una distribución de probabilidad $\mu$$S$, de modo que $$P(\text{you pick $k$ elements of $S$, according to $\mu$, without repeating}) < P(\text{you pick $k$ elements of $S$ uniformly, without repeating})$$

Para evitar la trivialidad asumen $1 < k < n$. (Supongo que la respuesta es no, traté de comprobación de la mano, pero me atoré).

La razón que pido, es que voy a enseñar el Birthdng Paradoja en la clase de los viernes, y, por supuesto, voy a asumir que el cumpleaños de una persona es distribuido uniformemente a lo largo del año. Esto es empíricamente falsa, y supongo que el hecho de que hay un sesgo hacia ciertos días aumenta la probabilidad de una compartido de cumpleaños. No quiero decir esto en clase sin la prueba, aunque.

2voto

BruceET Puntos 7117

Comentario: tal vez algo para mostrar su clase.

NOS Mensual de las tasas de Natalidad: Ene'97--Dic'99. Fuente: Centro Nacional para Estadísticas de Salud. [Ack: Esta es la Fig. 1.4 en Suess y Trumbo (2010).]

enter image description here

Una simulación con la actual distribución mensual de cumpleaños a la muestra que NOS natalidad están lo suficientemente cerca como para notar que la probabilidad de no coincidencia entre unos 20 y 30 personas se cambia por, tal vez, uno de los dígitos en el 2do lugar decimal. (Hay, por supuesto, un punto de ruptura. Usted no desea aplicar los resultados a una reunión de Sagitario de la Sociedad.)


La simulación en el software estadístico R de $P(\text{No match}) = 0.434 \pm 0.004$ uniforme de cumpleaños con $n = 25$ personas que:

n = 25;  m = 10^5;  x = numeric(m)
for (i in 1:m)  {
  b = sample(1:366, n, repl=T)
  x[i] = n - length(unique(b))  }
mean(x==0)
## 0.43438

El cálculo exacto:

prod(1 - (0:24)/365)
## 0.4313003

Simulación para un cumpleaños un poco más lejos de uniforme que la real NOS cumpleaños.

n = 25;  m = 10^5;  x = numeric(m)
w = c(rep(4,200), rep(5,165), 1)  # vector of 366 weights for birthrates
for (i in 1:m)  {
  b = sample(1:366, n, repl=T, prob=w)
 x[i] = n - length(unique(b))  }
mean(x==0)
## 0.4253

En la práctica, la probabilidad de modelado consiste en hacer suposiciones, generalmente de dos tipos: (a) los Supuestos esperamos son verdaderas, (b) los Supuestos que sabemos que son falso, pero la esperanza no se producen errores graves.

En el problema del cumpleaños, un ejemplo de (a) sería que, los 25 sujetos son elegido al azar, y un ejemplo de (b) sería que hay 365 igualmente probables cumpleaños en la población. Hemos demostrado por la simulación de que nuestras esperanzas para (b) son realistas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X