4 votos

Ayuda con la esperanza condicional de una convolución de variables aleatorias exponenciales

Estoy trabajando a través de este documento, con mucha ayuda de todos los grandes de la gente en este sitio. Obviamente mi estadística/probabilidad es una falta seguir todos los pasos matemáticos. Actualmente, estoy tratando de averiguar cómo la ecuación de $(12)$ se deriva de la ecuación de $(8)$:

dado el pdf $$f_n(t) = \frac{\binom{n+1}{2}}{2N}\exp\left(-\frac{\binom{n+1}{2}}{2N} t\right)\;\;\; (5) $$ La convolución de $f_{n-1}(t),f_{n-2}(t),\ldots,f_m(t)$ tiene la expectativa y de la varianza: $$E(t) = 2N\sum_{i=m+1}^{n}{\frac{1}{\binom{i}{2}}} = 2N \sum_{i=m+1}^{n}{\left(\frac{2}{i-l} - \frac{2}{i}\right)} = 4N\left(\frac{1}{m}-\frac{1}{n}\right) \;\;\; (8)\\ V(t) = 4N^2\sum_{i=m+1}^{n}{\frac{1}{\binom{i}{2}^2}} \;\;\; (9) $$ dado que la frecuencia de inicio de un mutante es $\frac{k}{2N}$, muestran la expectativa de $E\left(t\mid\frac{k}{2N}\right)$ (media de tiempo para $k$ alelos para ir a $2N$ alelos, también conocida como la fijación de tiempo (ya que hay que $2N$ de los alelos en la población)) es: $$ E\left(t\mid\frac{k}{2N}\right)=4N\left(1-\frac{1}{2N} - \sum_{i=1}^{k-1}{\frac{1}{i(i+1)}}\prod_{j=1}^{i}\frac{k-j}{2N-j} \right) \;\;\; (12) $$

así que, básicamente, la distribución exponencial de la lista anterior (ecuación de $(5)$) es la probabilidad de que $N+1$ en una muestra aleatoria de alelos vienen de $N$ antepasados. No entiendo por qué la esperanza condicional es diferente cuando se puede empezar con un número de alelos, que acaba de ser capaz de conectar $k$ $2N$ en la ecuación $(8)$: $$ E(t) = 4N\left(\frac{1}{k}-\frac{1}{2N}\right)\;? $$

Sé que esto es un poco ambiguo, sobre todo sin conocer los detalles del papel, pero estoy seguro de que alguien más conocedor de estadística/probabilidad probablemente puede identificar lo que los autores usan para derivar la última ecuación.

Asimismo, los puntos de bonificación si usted puede deducir la siguiente ecuación de $(12)$$N\to\infty$: $$E(t\mid p) = -4N(1/p - 1)\ln(1-p)\;,$$ donde $p=\frac{k}{2N}$.

Cualquier ayuda sería increíble!

1voto

Gregory Hill Puntos 51

Yo soy incapaz de entender el significado de $k$ $m$ en su ecuación y, por tanto, no puede decir el significado de la ecuación (12). Sin embargo, puedo dar una prueba de la asintótica de la ecuación. Espero que le ayude.
Para una fija $p(0<p<1)$, $k$ crecerá hasta el infinito como $N\to\infty$. Por simplicidad nos evaluar el resto término de la primera: $$\begin{align} \sum_{i=\sqrt[4]{k}}^{k-1}\frac{1}{i(i+1)}\prod_{j=1}^{i}\frac{k-j}{2N-j} & \leq\sum_{i=\sqrt[4]{k}}^{k-1}\frac{1}{i(i+1)}p^i\\ & \leq\sum_{i=\sqrt[4]{k}}^{\infty}\frac{1}{\sqrt{k}}p^i\\ & \leq\frac{1}{\sqrt{k}(1-p)} \end{align}$$ que tiende a $0$$k\to\infty$.
Ahora nos encontramos con la fórmula para $E(t|p)$. Tenga en cuenta que $$\begin{align} \sum_{i=1}^{\sqrt[4]{k}-1}\frac{1}{i(i+1)}\prod_{j=1}^{i}\frac{k-j}{2N-j} & =\sum_{i=1}^{\sqrt[4]{k}-1}\frac{1}{i(i+1)}\prod_{j=1}^{i}\frac{p-j/(2N)}{1-j/(2N)}\\ & =\sum_{i=1}^{\sqrt[4]{k}-1}\frac{1}{i(i+1)}\prod_{j=1}^{i}(p+O(j/N))\\ & =\sum_{i=1}^{\sqrt[4]{k}-1}\frac{1}{i(i+1)}\prod_{j=1}^{i}(p+O(k^{1/4}/N))\\ & =\sum_{i=1}^{\sqrt[4]{k}-1}\frac{1}{i(i+1)}(p^{i}+O(ik^{1/4}/N))\\ & =\left(\sum_{i=1}^{\sqrt[4]{k}-1}\frac{1}{i(i+1)}p^{i}\right)+O(k^{3/4}/N) \end{align}$$ Desde $k/2N=p$ es fijo, $O(k^{3/4}/N)=O(N^{-1/4})\to 0$$N\to\infty$.
Ahora la suma total evalúa a $$\begin{align} \lim_{N\to\infty}\sum_{i=1}^{k-1}\frac{1}{i(i+1)}\prod_{j=1}^{i}\frac{k-j}{2N-j} & =\lim_{N\to\infty}\left(\sum_{i=1}^{\sqrt[4]{k}-1}\frac{1}{i(i+1)}p^{i}\right)\\ & = \sum_{i=1}^{\infty}\frac{p^i}{i(i+1)}\\ & = \sum_{i=1}^{\infty}\frac{p^i}{i}-\sum_{i=1}^{\infty}\frac{p^i}{i+1}\\ & = \sum_{i=1}^{\infty}\frac{p^i}{i}-\frac{1}{p}\sum_{i=2}^{\infty}\frac{p^{i}}{i}\\ \end{align}$$ A partir de la fórmula de Taylor se puede ver $\ln(1-x)=-\sum_{i=1}^{\infty}x^i/i$. Por lo que la conclusión de la siguiente manera.

1voto

Daniel Weissman Puntos 458

(8) es el tiempo de espera para el seguimiento de $n$ copias de un alelo a $m$ ancestrales de copias, pero en (12) no sabemos cómo muchas de las iniciales $k$ copias van a tener descendientes en la población en el momento de la fijación, algunos probablemente tendrá linajes que se mueren antes. Tiene que haber al menos un antepasado, pero el número de ancestros $I$ podría ser cualquier cosa en $\{0,\ldots, k-1\}$. Para calcular el $E(t)$, vamos a tomar el total de tiempo para ir de $1$ antepasado de fijación, y luego restar el tiempo para ir de $1$ antepasado a $I+1$ antepasados (dada por (8), a pesar de (6), será más conveniente), ponderado por la probabilidad de que $I=i$: $$ E(t) = 4N\left(1-\frac{1}{2N}-\sum_{i=1}^{k-1}\frac{P(I\ge i)}{i(i+1)}\right). $$

Para encontrar $P(I\ge i)$, ahora podemos ir hacia el futuro, pasado el tiempo, cuando el alelo corrige todo el camino para cuando la población es descendiente de una sola de las iniciales $k$ copias. (Este tiempo existe con una probabilidad de $1$, y será el mismo que el de la fijación del tiempo iff $I=0$.) Ahora ir hacia atrás en el tiempo hasta el último punto donde no había una persona que no era descendiente de este último ganador. Con una probabilidad de $\frac{k-1}{2N-1}$, este individuo descendiente de uno de los otros $k-1$ copias, y $I \ge 1$; de lo contrario, $I=0$. Sigue yendo hacia atrás en el tiempo, y con una probabilidad de $\frac{k-2}{2N-2}$ el próximo individual con un nuevo antepasado bajará de uno de los restantes $k-2$ copias, etc. Por lo que la distribución de $I$ es $$ P(I\ge i) = \prod_{j=1}^i \frac{k-j}{2N-j}, $$ y (12) de la siguiente manera.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X