Resulta que el numéricos de los resultados sobre el $\mathbb{E}[N_3]$ por David E no es una coincidencia, es exacto!
$$\mathbb{E}[N_3] = \frac{1}{1-\sin(1)}$$
Deje $X_1, X_2, \ldots $ ser una secuencia de variables aleatorias. Para cada una de las $n$,
supondremos $X_n$ tomar el valor del conjunto $\langle n \rangle \stackrel{def}{=}\{ 1, 2, \ldots, n \}$ con probabilidad uniforme.
Después de la $n^{th}$ iteración, tenga en cuenta las siguientes variables aleatorias:
- $Y_{m} = \# \{ i \in \langle n \rangle : X_i = m \}$ ser el número de veces que el número de $m$ es elegido.
- $Z_{m} = \# \{ i \in \langle n \rangle : Y_i = m \}$ el número de números que ha sido escogida $m$ veces.
Para aquellos de configuración, donde ninguno de los número ha sido elegido más de dos veces,
$Z_{k}$ no son independientes el uno del otro. De hecho, si conocemos $Z_0 = p$, vamos a tener
$$Z_1 = n - 2p,\quad Z_2 = p\quad\text{ and }\quad Z_k = 0, \forall k > 2$$
Para este tipo de configuración, es claro en el $(n+1)^{th}$ iteración, la probabilidad de que
- $Z_0$ permanece inalterado es $\frac{p+1}{n+1}$.
- $Z_0$ aumenta por $1$$\frac{n-2p}{n+1}$.
- algunos número elegido $3$ veces es $\frac{p}{n+1}$.
Si definimos
- $f_{n,p} = \mathbb{P}\left[ Z_0 = p, Z_1 = 2n-p, Z_2 = p, Z_k > 0 \land \forall k > 2 \right]$
- $f_n(z) = \sum_{p=0}^n f_{n,p} z^p$,
- $F(z,t) = 1 + \sum_{n=1}^\infty f_n(z) t^n$
Nos encontramos con $f_{n,p}$ satisfacer la siguiente relación de recurrencia:
$$
f_{n+1,p}
= \frac{p+1}{n+1}f_{n,p} + \frac{n-2(p-1)}{n+1}\begin{cases} f_{n,p-1}, & p > 0\\0, &p = 0\end{casos}\\
\implica
(n+1) f_{n+1}(z) =
\left\{ \left(1 + z\frac{\partial}{\partial z}\right)
+ z\a la izquierda( n - 2z\frac{\partial}{\partial z}\right) \right\} f_n(z)
$$
Multiplicar cada término por $t^n$ y suma y aviso de $f_1(z) = 1$, podemos encontrar:
$$\begin{align}
& \frac{\partial}{\partial t} ( F(t,z) - 1 - t )
= \left\{
\left(1 + z\frac{\partial}{\partial z}\right)
+
z\left( t\frac{\partial}{\partial t} - 2z\frac{\partial}{\partial z}\right)
\right\} ( F(z,t) - 1)\\
\iff &
\left\{ (1 - zt)\frac{\partial}{\partial t}
- (1 + z(1-2z)\frac{\partial}{\partial t}\right\} F(z,t) = 0\\
\iff &
\left\{ (1 - zt)\frac{\partial}{\partial t}
- z(1-2z)\frac{\partial}{\partial t}\right\} \left( \frac{z}{1-2z} F(z,t) \right) = 0
\end{align}
$$
Utilizando el método de las características, se puede mostrar que la solución general de la última PDE tiene la forma
$$F(z,t) = \frac{1-2z}{z} \varphi\left(\frac{1-\sqrt{1-2z}}{1+\sqrt{1-2z}}e^{t\sqrt{1-2z}}\right)$$
donde $\varphi(\cdots)$ es una función arbitraria. Podemos determinar $\varphi(\cdots)$ por ajuste a $t = 0$, tenemos
$$\frac{1-2z}{z} \varphi\left(\frac{1-\sqrt{1-2z}}{1+\sqrt{1-2z}}\right) = F(z,0) = 1$$
Después de un poco de álgebra, obtenemos
$$F(z,t) = \frac{4u^2 e^{tu}}{((1+u) - (1-u) e^{tu})^2}
\quad\text{ donde }\quad
u = \sqrt{1-2z}
$$
Aviso para cada $n$, $f_n(1) = \sum_{p=0}^n f_{n,p}$ es la probabilidad de que ninguno de los números ha sido elegido más de dos veces. Esto significa
$f_{n-1}(1) - f_n(1)$ es la probabilidad de que algunas de las "nuevas" número elegido en el tercer momento. Así que el número que queremos es
$$\mathbb{E}[N_3] = (1-f_1(1)) + \sum_{n=2}^\infty n (f_{n-1}(1) - f_{n}(1))
= 1 + \sum_{n=1}^\infty f_n(1) = F(1,1)$$
Sustituir este regreso a nuestro expresión de $F(z,t)$, obtenemos
$$\begin{align}
\mathbb{E}[N_3]
& = \frac{4i^2 e^i}{((1+i) - (1-i) e^i)^2} = \frac{1}{1-\sin(1)}\\
& \approx 6.307993516443740027513521739824160128971342...
\end{align}
$$
Hay otras estadísticas interesantes se pueden recoger a partir de $F(z,t)$. Por ejemplo,
la generación de la función para la "supervivencia" de la probabilidad $f_n(1)$ es
$$P_{survival}(t) \stackrel{def}{=} 1 + \sum_{n=0}f_n(1)t^n = F(1,t) = \frac{1}{1-\sin(t)}$$
y que para que la probabilidad de que "la muerte en $3^{rd}$ huelga" en el paso $n$ es
$$\begin{align}
P_{3^{rd} strike}(t) & \stackrel{def}{=} (1-f_1(1)) t + \sum_{n=2}^\infty (f_{n-1}(1) - f_{n}(1)) t^n\\
& = (t - 1) P_{survival}(t) + 1 = \frac{t-1}{1-\sin(t)} + 1
\end{align}$$
Si un lanzamiento de la última expresión a la CAS y preguntar para calcular la expansión de Taylor, uno conseguir
$$\begin{align}
P_{3^{rd} strike}(t) =
& \frac{1}{6}t^3 + \frac{1}{6}t^4 + \frac{19}{120}t^5 + \frac{47}{360}t^6
+\frac{173}{1680}t^7 + \frac{131}{1680} t^8 +\frac{20903}{362880}t^9\\
& +\frac{75709}{1814400}t^{10} + \frac{1188947}{39916800}t^{11}
+\frac{2516231}{119750400}t^{12} + \cdots
\end{align}$$
El coeficiente de $t^k$ coincide con los números de $Pr[N_3 = k]$ aparece en otra respuesta.
Actualización 1
Vamos a ser Don Quijote y desafiar el más difícil problema de la informática $\mathbb{E}[N_y]$$y > 3$.
Similar a $y = 3$, se puede configurar un PDE para la generación de funciones.
Sin embargo, si sólo desea $\mathbb{E}[N_y]$, no es necesario para resolver el PDE completamente. Uno puede usar el método de las características y expresar $\mathbb{E}[N_y]$
en cuanto a las soluciones de algunos de ODE.
La derivación es un lío. Me ahorraré detalles aburridos y aquí está la receta:
El caso de $y = 4$ es sencillo, uno puede mostrar que
$$\mathbb{E}[N_4] = \frac{\rho^3 + 3\rho + 2}{6}
\;\;\text{ donde }\;\;
\rho \;\;\text{ satisface }\;\;
1 = \int_1^\rho \frac{6ds}{s^3 + 3s + 2}
$$
Para general $y$, la instalación de un sistema de educación a distancia en $y+1$ varibles $\psi, t, z_1, z_2, \ldots, z_{y-1}$:
$$
\frac{d\psi}{d\tau} = z_1 \psi\quad
\frac{dt}{d\tau} = t z_1-1\quad
\quad\text{ y }\quad
\frac{dz_k}{d\tau} =
\begin{cases}
-z_k(z_k - z_{k+1}), & k < y-1\\
-z_k^2, & k = y-1
\end{casos}
$$
Si uno empezar a integrar este sistema de educación a distancia utilizando los valores iniciales
$$( \psi, t, z_1, \ldots, z_{y-1} ) = (1, 1, \ldots, 1 )\quad\text{ at }\quad \tau = 0$$
hasta el punto de $\rho$ donde$t(\rho) = 0$, $\psi(\rho)$ será igual a la
número de $\mathbb{E}[N_y]$ buscamos.
Siguientes son algunos de los resultados numéricos. La etiqueta $\verb/R1/$ $\verb/R2/$ indican que la receta ha sido utilizado para calcular el resultado. El número detrás de
la etiqueta $\verb/R2/$ es el máximo de tiempo utilizado en numéricamente la integración.
$$\begin{array}{c:l:l}
y & \mathbb{E}[N_y] & \verb/methodology/\\
\hline
2 & 6.30799351644374 & \verb/exact/ = \frac{1}{1-\sin 1}\\
2 & 6.3079930650 & \verb/R2 /(10^{-4})\\
2 & 6.3079935164 & \verb/R2 /(10^{-6})\\
\hline
3 & 13.77250982352477 & \verb/R1/ \\
3 & 13.7725078084 & \verb/R2 /(10^{-4})\\
3 & 13.7725098234 & \verb/R2 /(10^{-6})\\
\hline
4 & 29.1475420469 & \verb/R2 /(10^{-4})\\
4 & 29.1475467696 & \verb/R2 /(10^{-6})\\
\hline
5 & 60.5714357748 & \verb/R2 /(10^{-4})\\
5 & 60.5714459868 & \verb/R2 /(10^{-6})\\
\hline
6 & 124.4243032167 & \verb/R2 /(10^{-4})\\
6 & 124.4243208364 & \verb/R2 /(10^{-6})
\end{array}
$$
Como se puede ver, $\mathbb{E}[N_y]$ le parece a aproximadamente el doble por cada incremento de $y$.
Actualización 2
Resulta que parte de la necesidad de la educación a distancia en la Actualización 1 se puede resolver de forma explícita.
Para cualquier $y \ge 3$$k = 1,2,\ldots,y-1$, tenemos
$$z_{k}(s) = \frac{e_{y-k-1}(s)}{e_{y k}(s)}
\quad\text{ donde }\quad
e_m(x) = \sum_{k=0}^{m} \frac{x^k}{k!}$$
La nueva simplificado receta es
$$\mathbb{E}[N_y] = e_{y-1}(\rho)
\quad\text{ donde }\quad
\rho \quad\text{ es raíz de la ecuación }\quad
1 = \int_0^\rho \frac{ds}{e_{y-1}(s)}
$$
Siguiente es algunos resultados numéricos calculados utilizando esta nueva receta.
Todos los números se ha truncado a 6 decimales para facilitar la comparación.
Como se puede ver a partir de las $3^{rd}$ columna $2^y$ es razonable decente
$1^{st}$ orden de aproximación para $\mathbb{E}[N_y]$ $y$ crece.
$$\begin{array}{r:r:l}
y & \mathbb{E}[N_y] & \mathbb{E}[N_y]/2^y\\
\hline
3 & 6.307993 & 0.788499\\
4 & 13.772509 & 0.860781\\
5 & 29.147546 & 0.910860\\
6 & 60.571445 & 0.946428\\
7 & 124.424320 & 0.972065\\
8 & 253.615739 & 0.990686\\
9 & 514.170899 & 1.004240\\
10& 1038.407593 & 1.014069\\
11& 2091.272044 & 1.021128\\
12& 4202.932580 & 1.026106\\
13& 8433.748402 & 1.029510\\
14& 16903.678242 & 1.031718\\
15& 33849.909944 & 1.033017
\end{array}
$$