La pregunta indaga acerca de la relación entre la hora de la mortalidad y la distribución exponencial de la duración de la vida.
El universo se divide el tiempo en corto garrapatas. Para cada abeja un dado es lanzado. El dado tiene muchos lados, la mayoría de ellas en blanco ... pero una es de color negro. La muerte viene de la abeja siempre el lado negro de la muestra.
Estamos a punto de simular esta con el equipo, pero la pereza no quiero rebanada de tiempo tan finamente como hace la Muerte. Así que en lugar de rodar una mueren cada segundo, digo, tal vez me va a rodar una cada hora mueren: pero voy a hacer 3600 veces más propensos a mostrar su lado negro para compensar la escasez de rollos. Debido a que la posibilidad de la muerte en una segunda o incluso una hora es tan pequeño, esta es una buena aproximación.
Para explotar la capacidad de la computadora para hacer un montón de cálculos con matrices a la vez, voy a simular toda una colmena una abeja en un momento. Vamos a la tirada de dados una y otra vez, una vez por hora, hasta que la abeja muere. Luego continuar con un recién nacido (reencarnar?) abeja, repitiendo hasta muchas abejas nacen y mueren. El resultado será el mismo como si todas las abejas han coexistido.
Aquí es R
código. Su entrada es la matriz de abeja vidas, bees
, utilizado para la estimación de la velocidad exponencial.
set.seed(17) # (Allows reproducible results)
n <- 10^5 # Number of time slices
units <- 1 # Number of hours per time slice
rate.hat <- 1 / mean(bees) # ML estimate of the death rate
deaths <- runif(n) < rate.hat * units # Roll Death's die
times <- which(deaths != 0) # Note when bees are killed
lifetimes <- (diff(c(0,times))-1) * units # The time differences are the bee lifetimes
Aquí está la primera parte de la deaths
de la matriz, mostrando los resultados de comienzo morir rollos (con "*" denota la cara negra):
paste(ifelse(head(deaths, 100),"*", "."), collapse="")
...........*
......................................................*
..............*
..................
El primer par de veces en el que el color negro de la cara apareció en el morir:
head(times)
12 67 82 120 134 147
Así, la primera abeja fue derribado en el 12 de garrapata (así que me cuente su vida como sólo 11 de las garrapatas), el segundo en la 67ª sesión de la garrapata (para toda la vida de 54 garrapatas), y así sucesivamente: estas son las posiciones de las estrellas en la salida anterior.
Las cifras de la parcela estas muertes (cada uno es una barra vertical a la izquierda, mostrando cada uno de toda la vida como un espacio horizontal entre barras) y la distribución de los tiempos de vida (a la derecha). El último tiene una distribución exponencial la función superpuesta. Es un excelente ajuste.
![Figure]()
El código para graficar el histograma es
hist(lifetimes, freq=FALSE, ylim=c(0, rate.hat), breaks=25, xlab="Hours")
curve(dexp(x, rate=rate.hat), col="Red", add=TRUE)
¿Por qué es el histograma exponencial? Debido a que en promedio el número de abejas vivas después de cierta edad se reduce en la misma fracción durante el siguiente intervalo de tiempo. Eso significa que el histograma tiene a disminuir exponencialmente.
Por cierto, la razón por la 1/mean(bees)
es el estimador de máxima verosimilitud es que la exponencial de la función de distribución de probabilidad es de la forma κexp(−κt)κexp(−κt) toda la vida tt. Para entender esto, recordemos que un PDF es un densidad: nos da la probabilidad por unidad de tiempo. Desde tt es el tiempo (en horas), κκ debe ser una probabilidad (de la muerte) por unidad de tiempo: es la tasa de interés. Su logaritmo es igual a log(κ)−κtlog(κ)−κt. Por lo tanto, el registro de probabilidad de un conjunto de datos de tiempos de vida de (t1,t2,…,tn)(t1,t2,…,tn) es
log(L(κ))=nlog(κ)−n∑i=1κti.log(L(κ))=nlog(κ)−n∑i=1κti.
Calculus shows us (by taking the derivative with respect to κκ and setting that to zero) that ˆκ=n∑ni=1ti^κ=n∑ni=1ti es el único punto crítico (y que, obviamente, es donde la probabilidad es maximizada). Este es el recíproco de la media de toda la vida. Que es como hora de mortalidad encaja con el de máxima verosimilitud de la maquinaria.