Sólo hay un Sr. Triplemente problemático. De hecho, a menos que tenga un hijo al que transmitir su apellido, será el último Sr. Tripletoddletrouble. Las costumbres sociales de su tiempo y lugar lamentablemente no permiten que un apellido tan exquisito sobreviva pasando por la línea femenina.
El Sr. Tripletoddletrouble tiene un raro y matemáticamente conveniente condición genética, que heredarán las futuras generaciones de Tripletoddletroubles heredará: si engendra algún hijo, y hay un 50% de posibilidades de que lo haga, será un conjunto de trillizos . Así que en cada paso del árbol genealógico vemos, con la misma probabilidad, o tres hijos o ninguno.
Las malas noticias para onomatólogos es esto deja un 50% de posibilidades de que un nombre maravilloso se extinga entre la próxima generación. La buena noticia es que cada Mr. Tripletoddletrouble tiene, por término medio, 1,5 hijos. la población esperada de Tripletoddletroubles goza de un crecimiento crecimiento exponencial, y hay una probabilidad positiva de que su apellido sobreviva para siempre .
¿Cuál es la probabilidad de que el apellido Tripletoddletrouble se extinga?
Aquí hay un rápido R
simulación.
set.seed(123)
nsims <- 1e5
ngens <- 20
simulate_extinction <- function(ngens) {
nsurvivors <- c(1, rep(NA, ngens - 1))
for (gen in seq_len(ngens - 1)) {
nsurvivors[gen + 1] <- 3 * rbinom(1, nsurvivors[gen], 0.5)
}
extinct <- (!is.na(nsurvivors) & nsurvivors == 0) # rbinom gives NA if population huge
return(extinct)
}
pextinct <- rowMeans(replicate(n = nsims, simulate_extinction(ngens)))
plot(pextinct, xlab = "Generation number", ylab = "Probability of extinction")
abline(h = (sqrt(5) - 1)/2, col = "red")
sprintf("Estimated probability of extinction = %f", pextinct[ngens])
La línea roja del gráfico está en
$$\varphi - 1 = \varphi^{-1} = \frac{\sqrt{5} - 1}{2} \approx 0.618034 $$
[1] "Estimated probability of extinction = 0.618150"
Esta es una pregunta sobre procesos de bifurcación . De hecho, una de las primeras investigaciones sobre su comportamiento estocástico tuvo su origen en la preocupación victoriana por la extinción de apellidos poco comunes. El resultado Proceso de Galton-Watson está disponible en línea:
"O bien 3 o bien 0 descendientes, con la misma probabilidad" es posiblemente la más sencillo proceso de bifurcación con probabilidad de extinción no trivial. Necesitamos al menos dos resultados si el azar juega un papel, incluyendo cero descendientes para que la extinción sea posible. "O bien 1 o bien 0 descendientes" está claramente condenado: sin ramas que broten, la línea familiar se extingue la primera vez que no hay hijos. "O 2 o 0 descendientes, igualmente probable" da una media de exactamente un descendiente para reemplazar a cada individuo. Cuando el destino se equilibra en este filo de la navaja, resulta que la extinción es segura a largo plazo, incluso si el árbol familiar brota con éxito unas cuantas veces. Podríamos ajustar la distribución de la descendencia para producir un rango de probabilidades de extinción deseadas, pero sólo introduciendo probabilidades desiguales o más de dos resultados. Esta configuración no siente artificialmente "afinado" para meter con calzador la proporción áurea.
Busquemos la probabilidad de extinción final, $\theta$ algebraicamente. Intuitivamente, esta probabilidad se divide en dos partes: o bien el Sr. Tripletoddletrouble original no tiene hijos y su línea se extingue inmediatamente, o tiene tres hijos con éxito, pero cada una de sus tres líneas acaba extinguiéndose. Dado que un hijo está en la misma posición que el Sr. Tripletoddletrouble original, sus líneas también tienen cada una la probabilidad de extinción $\theta$ . Dado que sólo nos ocupamos de los descendientes masculinos directos, el destino de cada línea es independiente de las demás. Dado que hay tres hijos, la probabilidad de que el apellido se extinga es, por tanto, de $\theta^3$ .
En el diagrama de árbol, vemos que la probabilidad de extinción $\theta$ debe obedecer a la ecuación
$$\theta = \frac{1}{2} + \frac{1}{2}\theta^3 \tag{1}$$
que podemos resolver (y lo haremos, en breve). En primer lugar, vamos a relacionar esto con una teoría más amplia de los procesos de ramificación. El número de descendientes de cualquier individuo es una variable aleatoria con una distribución de probabilidad $p_0 = p_3 = 0.5$ et $p_n = 0$ de otro modo, por lo que su función generadora de probabilidad es:
$$\Pi(s) = \sum_n p_n s^n = \frac{1}{2} + \frac{1}{2} s^3 $$
¿Te resulta familiar? No es una coincidencia. Más adelante. Evaluando la derivada de la pgf en $s=1$ obtenemos el número medio de crías. Este número $R_0 = \Pi'(1)$ es importante en la ecología de la población y en la demografía humana, donde se denomina tasa de reproducción neta (normalmente se define como el número medio de hijas producidas por cada hembra, en lugar de hijos por cada macho - la maternidad es más fácil de rastrear que la paternidad, y en muchas especies las hembras pueden reproducirse por partenogénesis ), mientras que en epidemiología es el número básico de reproducción (número medio de infecciones generadas directamente por un individuo infectado, en una población totalmente susceptible). Si $\Pi'(1) \leq 1$ entonces la extinción final es segura. Si $\Pi'(1) \gt 1$ la probabilidad de extinción es inferior a uno. Tenemos
$$\Pi'(s) = \frac{3s^2}{2} \implies \Pi'(1) = 1.5 > 1$$
por lo que el apellido tiene una probabilidad positiva de supervivencia. Cuántos ¿Sobrevive el triple de problemas en cada generación? Tome un individuo como "generación cero", y deje que $Z_n$ sea el número de descendientes después de $n$ generaciones. $Z_n$ es una variable aleatoria cuya distribución de probabilidad puede leerse a partir de los coeficientes de su pgf $\Pi_{n}(s)$ que encontramos aplicando iterativamente $\Pi$ , la descendencia pgf, $n$ tiempos:
$$\Pi_{n}(s) = \Pi(\dots\Pi(\Pi(s))\dots) $$
¿Por qué? $Z_{n}$ es la suma de la descendencia del $Z_{n-1}$ supervivientes de la generación anterior. Los números de descendientes de cada superviviente son variables aleatorias independientes e idénticamente distribuidas (iid) con pgf $\Pi$ y el número de ellos que estamos sumando tiene pgf $\Pi_{n-1}$ por lo que por la regla de la pgf de la suma de un número aleatorio de variables iid ( prueba en esta respuesta ), $Z_n$ tiene pgf $\Pi_{n}(s) = \Pi_{n-1}(\Pi(s))$ . Por ejemplo, después de dos generaciones
$$\Pi_2(s) = \Pi(\Pi(s)) = \frac{1}{2} + \frac{1}{2} \left(\frac{1}{2} + \frac{s^3}{2} \right)^3 = \frac{9}{16} + \frac{3s^3}{16} + \frac{3s^6}{16} + \frac{s^9}{16} $$
por lo que hay un $\frac{1}{16}$ posibilidad de nueve descendientes pero $\Pi_2(0) = \frac{9}{16}$ posibilidad de que la extinción ya se haya producido. $\mathbb{E}(Z_2)$ el número esperado de descendientes después de dos generaciones, se halla mediante $\Pi'_2(1) = 2.25$ . No es casualidad que esto sea igual a $1.5^2$ .
La media y la varianza del número de descendientes de un solo individuo son $\mu = \Pi'(1)$ et $\sigma^2 = \Pi''(1) + \mu - \mu^2$ . Se puede demostrar por inducción que $\mathbb{E}(Z_n) = \mu^n$ . Ahora es obvio por qué la extinción final es segura cuando $\mu < 1$ . Con $\mu = 1.5$ vemos un crecimiento exponencial de media a pesar de nuestra alta probabilidad de extinción temprana. Esencialmente, las cadenas de transmisión de apellidos tienden a esfumarse o a estallar, y $\mu = 1.5$ garantiza las suficientes posibilidades de explotar que la extinción no es inevitable. Una buena noticia para los Tripletoddletroubles; una mala noticia si cambiamos el contexto de los apellidos a las enfermedades infecciosas con $R_0 > 1$ . La forma en que las cadenas de infección pueden "ir a lo grande o irse a casa" de forma aleatoria, en lugar de seguir una regla determinista como "cada caso infecta exactamente a dos susceptibles", se relaciona con la idea epidemiológica de sobredispersión debido a eventos de agrupación o superdifusión. La varianza del número de descendientes después de $n$ generaciones puede ser considerable, ya que $Z_n$ puede ser enorme o nula. De nuevo por inducción, encontramos:
$$\operatorname{Var}(Z_n) = \begin{cases} \frac{\mu^{n-1} \sigma^2 \left(\mu^n - 1\right)}{\mu - 1}, & \mu \neq 1 \\[2ex] n \sigma^2, & \mu = 1 \end{cases}$$
En general, la probabilidad de extinción final es la solución positiva más pequeña , $\theta^{*}$ de la ecuación $\theta = \Pi(\theta)$ . Esa es exactamente la ecuación $(1)$ ¡que derivamos arriba! Pero, ¿cómo sabíamos qué solución tomar? La probabilidad de extinción por generación $n$ es $\Pi_n(0)$ ya que es la constante o $s^0$ término de la pgf de $Z_n$ por lo que representa $\Pr(Z_n = 0)$ . La probabilidad de extinción final debe ser $\lim_{n \to \infty} \Pi_n(0)$ que podemos encontrar utilizando un trama de telarañas de $y=\Pi(x)$ et $y=x$ para $0 \le x \le 1$ . Desde $\Pi(0) = p_0$ la probabilidad de que un individuo no tenga descendencia, podemos suponer que la intersección y está entre $0 \lt \Pi(0) \le 1$ (si $p_0 = 0$ entonces la extinción es claramente imposible). Así que $y = \Pi(x)$ comienza arriba $y=x$ y la primera vez que se cruza $y=x$ debe ser de arriba. Ya que $\Pi(x)$ y sus derivadas sólo tienen coeficientes no negativos, su gráfica es creciente y convexa en $0 \le x \le 1$ . Esto significa que puede cruzar $y=x$ como máximo dos veces en este intervalo: una desde arriba y otra desde abajo. $\Pi(1) = \sum p_n = 1$ por lo que los gráficos ciertamente se cruzan en $(1,1)$ .
La naturaleza de esta intersección depende de la pendiente $\Pi'(1)$ que representa el número medio de crías $\mu$ (biológicamente, $R_0$ ). Si $\Pi'(1) > 1$ debe ser más pronunciado que $y=x$ así que $y = \Pi(x)$ está golpeando la línea desde abajo, en cuyo caso debe haber habido una intersección anterior en $0 \lt x \lt 1$ . Si $\Pi'(1) < 1$ es más superficial por lo que se golpea desde arriba, y no hay una raíz anterior. Si $\Pi'(1) = 1$ las dos curvas sólo se tocan en $(1,1)$ pero $y = \Pi(x)$ debe haber sido más superficial antes (su pendiente media sobre $0 \le x \le 1$ es $1 - p_0$ así que por debajo de uno), por lo tanto se acerca a la línea desde arriba y no puede haber una raíz anterior. Por eso, si $\mu=1$ pero $p_0 > 0$ La extinción final tiene probabilidad uno.
Para encontrar $\lim_{n \to \infty} \Pi_n(0)$ gráficamente, leer horizontalmente desde la intersección y en $y = \Pi(0)$ a la $y=x$ línea, donde ahora $x = \Pi(0)$ . A continuación, lea verticalmente a la $y = \Pi(x)$ gráfico, donde ahora $y = \Pi(\Pi(x)) = \Pi_2(x)$ . Léase horizontalmente a la línea así $x = \Pi_2(x)$ . Léase verticalmente a la curva para que $y = \Pi(\Pi_2(x)) = \Pi_3(x)$ . Obsérvese que todas las lecturas horizontales son hacia la derecha y las verticales hacia arriba, ya que $y = \Pi(x)$ es creciente por lo que cada posición vertical está por encima de la anterior. Este procedimiento debe converger a la primero (es decir, el menor positivo $x$ ) punto de intersección $x = \Pi(x)$ , donde $y = \Pi(x)$ golpea $y = x$ desde arriba. Ilustramos los tres casos $\mu = 1.5$ ( $p_0 = p_3 = \frac{1}{2}$ ), $\mu = 1$ ( $p_0 = \frac{2}{3}, p_3 = \frac{1}{3}$ ) y $\mu = 0.5$ ( $p_0 = \frac{5}{6}, p_3 = \frac{1}{6}$ ). La línea azul punteada es la tangente a $y = \Pi(x)$ en $(1, 1)$ y muestra el papel de su pendiente $\Pi'(1) = \mu$ para determinar si hubo una intersección anterior.
Necesitamos la solución positiva más pequeña $\theta*$ de $(1)$ . Moviendo $\theta$ al lado derecho y doblando para despejar las fracciones, obtenemos:
$$0 = \theta^3 - 2 \theta + 1 = (\theta - 1)(\theta^2 + \theta - 1)$$
Las soluciones son $-\varphi < \varphi^{-1} < 1$ por lo que la solución positiva más pequeña es $\theta^{*} = \varphi^{-1}$ .
Es hora de revelar el "violín". Este enlace a la proporción áurea no es un resultado que recuerde haber visto antes, pero hice ingeniería inversa pensando en la factorización requerida de la ecuación final. Como $\Pi(1) = \sum p_n = 1$ Siempre tenemos $\theta = 1$ como raíz de $\theta = \Pi(\theta)$ Así que $(\theta - 1)$ debe aparecer como factor una vez que que uno de los lados sea cero. También sabía qué cuadrática quería ver. Después trabajé de nuevo para intentar formar una pgf válida. Los coeficientes negativos de coeficientes negativos no están permitidos; los coeficientes positivos sólo positivos sólo hay que normalizarlos para que sumen la unidad. Esperaba que la distribución de probabilidad resultante para la descendencia fuera una "bonita", ¡y creo que lo es!
Código R para el gráfico cobweb
ngens <- 100
par(mfrow=c(1, 3), pty = "s", xaxs = "i", yaxs = "i")
for(p0 in c(1/2, 2/3, 5/6)) {
pgf <- function(x) {p0 + (1-p0)*x^3}
mu <- p0*0 + (1-p0)*3
plot(pgf, xlim = c(0,1), ylim = c(0,1), xlab = "", ylab = "",
main = paste0("Mean offspring = ", mu))
segments(0, 0, 1, 1)
abline(1 - mu, mu, col = "blue", lty = "dotted")
pextinct <- c(0, rep(NA, ngens))
for (n in seq_len(ngens)) {
pextinct[n + 1] <- pgf(pextinct[n])
segments(pextinct[n], pextinct[n], pextinct[n], pextinct[n + 1], col = "red")
segments(pextinct[n], pextinct[n + 1], pextinct[n + 1], pextinct[n + 1], col = "red")
}
print(pextinct)
}