Tengo una variante del problema del recolector de cupones en la que hay $n$ cupones diferentes, que se sortean con igual probabilidad y con reemplazo, pero se necesitan 2 copias de cada cupón. Supongamos que tengo un total de $X$ número de cupones pertinentes recogidos del $2n$ número total de cupones para un juego completo, y quiere saber cuántos cupones extra innecesarios debe tener. ¿Cuál sería una ecuación para eso? He encontrado en Wikipedia una ecuación para el número de sorteos necesarios para obtener un juego completo de uno de cada cupón, y el número de sorteos necesarios para obtener un juego completo de múltiples copias de cada cupón.
$E(T) = n\log{n} + n + {\frac{1}{2}} + O({\frac{1}{n}})$ donde $\gamma \approx 0.5772156649$
$E(Tm) = n\log{n} + (m-1)n\log\log{n} + O(n)$ como $n$
Dónde $m$ es el número de ejemplares de cada cupón que hay que recoger, por tanto 2 en este caso, y $Tm$ es la primera vez $m$ copias de cada cupón.
También encontré esto en una pregunta anterior. Problema del coleccionista de cupones con X cantidad de cupones ya reunidos.
La probabilidad $p_i$ de seleccionar un nuevo cupón es igual a $\frac{n-i+1}{n}$ y el número esperado de extracciones necesarias para extraer un nuevo cupón es igual a $\frac{1}{p_i} = \frac{n}{n-i+1}$ . Por lo tanto, el valor esperado del tiempo necesario para extraer todos los $n$ los cupones pueden calcularse como:
$$E[T] = \frac{n}{n} + \frac{n}{n-1} + \ldots + \frac{n}{1} = n \sum_{k=1}^{n}{\frac{1}{k}}$$
En este caso, sin embargo, ya hemos extraído $X$ cupones únicos. Por ello, el número estimado de sorteos necesarios para encontrar todos los $n$ los cupones son iguales:
$$E[T] = E[t_{X+1}] + E[t_{X+2}] + \ldots + E[t_n] = n \sum_{k=1}^{n-X} \frac{1}{k}$$
Por tanto, para hallar el número total de cupones extraídos al recoger el $X^{th}$ cupón único, la ecuación sería $$n \sum_{k=1}^{n}{\frac{1}{k}}-n \sum_{k=1}^{n-X} \frac{1}{k} $$
El número total de cupones duplicados sólo innecesarios sería de $$n \sum_{k=1}^{n}{\frac{1}{k}}- n \sum_{k=1}^{n-X} \frac{1}{k} - X $$
No estoy seguro de cómo combinar estas dos ecuaciones, $E(Tm) = n\log{n} + (m-1)n\log\log{n} + O(n)$ como $n$ y $n \sum_{k=1}^{n}{\frac{1}{k}}-n \sum_{k=1}^{n-X} \frac{1}{k}$ , para obtener el número total de cupones sorteados al tener X número de cupones relevantes reunidos hacia una colección completa de 2 de cada cupón. A continuación, con esa ecuación sólo hay que restar X (el número de cupones relevantes recogidos) del número total para obtener el total de cupones innecesarios. Admitiré que no tengo una profesión matemática ni he hecho matemáticas de nivel superior últimamente, pero si he entendido bien la primera ecuación es más una aproximación del valor, mientras que la segunda ecuación es más exacta. Así que no estoy seguro de cómo combinarlas o si se pueden combinar fácilmente.
También entiendo un poco $O(n)$ y su uso, no estoy seguro de cómo introducirlo con el resto de la ecuación en wolframalpha o incluso Excel, el objetivo final de donde quiero usar esta ecuación. El número máximo de cupones sería de unos 100 si eso ayuda. Si sería más fácil, el número total de cupones que tienen sólo 1 copia y el número de cupones que tienen 2 copias recogidas podría ser utilizado como una entrada en lugar del número total de cupones pertinentes recogidos.