Aquí está mi aproximación asintótica:
Vamos a considerar la (equivalente, como ha señalado Henry) en caso de fuertes composiciones de $n+k=m$ a $k$ positivo partes.
En términos probabilísticos, tenemos $k$ variables aleatorias $x_i$ tomando valores en $1\cdots m$,
con $\sum x_i =m$ y fueron todas las posibles realizaciones son equiprobables.
Yo reclamo (si mi vida no depende de ella) que el problema es asintóticamente equivalente (¿por qué? ¿en qué sentido? se explica a continuación) para tener
$k$ iid geométricas variables aleatorias $y_i$ (tomando valores en $1\cdots \infty$) con una media de $m/k=1/p$ (aviso que aquí $\sum y_i$ no es fijo, sino $E[\sum y_i] =m$).
Entonces, una primera aproximación sería
$\displaystyle E_M = E(max(x_i)) -1 \approx E(max(y_i)) -1 = G\left(k,\frac{k}{k+n}\right) - 1$
donde $G(k,p)$ la expectativa de que el máximo de $k$ IID geométrica de las variables aleatorias de parámetro $p$. Este problema más tarde se discute aquí y aquí. La fórmula exacta es bastante complicada:
$\displaystyle G(k,p) = \sum_{i=1}^k \binom{k}{i} (-1)^{i+1} \frac{1}{1-(1-p)^i}$
Una estrecha aproximación está dada por:
$\displaystyle G(k,p) \approx \frac{H_k}{- \log(1-p)} + \frac{1}{2} $ , $\displaystyle H_k=\sum_{i=1}^k \frac{1}{i}$ (número armónico).
lo que da a nuestra segunda aproximación:
$\displaystyle E_M \approx \frac{H_k}{\log(1+k/n)} - \frac{1}{2}$
Y para $n$ aumento de la con $k$ constante, el primer fin de la expansión del logaritmo
da esta tercera aproximación, que muestra el aumento lineal observada por Henry:
$\displaystyle E_M \approx n \frac{ H_k} {k} - \frac{1}{2} \approx n \frac{ H_k} {k}$ $ \hspace{14pt} (n \to \infty)$
También es fácil ver que si tanto $n,k$ de incremento con relación constante, a continuación, $E_M$ crece como $\log(k)$.
Algunos de los resultados, para comparar con la de Henry valores, para la segunda aproximación (muy similar a la primera; y la tercera es bastante más grueso)
1 2 3 4 5 6 7 8 9 10
1 0.9427 0.8654 0.8225 0.7944 0.7744 0.7591 0.7469 0.7370 0.7286 0.7215
2 1.9663 1.6640 1.5008 1.3963 1.3226 1.2673 1.2239 1.1887 1.1595 1.1347
3 2.9761 2.4364 2.1449 1.9588 1.8280 1.7301 1.6536 1.5918 1.5407 1.4975
4 3.9814 3.1995 2.7761 2.5056 2.3157 2.1738 2.0631 1.9739 1.9002 1.8380
5 4.9848 3.9580 3.4007 3.0444 2.7942 2.6073 2.4617 2.3444 2.2476 2.1661
6 5.9872 4.7141 4.0216 3.5784 3.2670 3.0346 2.8535 2.7077 2.5874 2.4862
7 6.9889 5.4686 4.6401 4.1093 3.7363 3.4577 3.2407 3.0661 2.9221 2.8010
8 7.9902 6.2221 5.2570 4.6381 4.2030 3.8780 3.6248 3.4210 3.2531 3.1119
9 8.9912 6.9749 5.8728 5.1655 4.6679 4.2962 4.0065 3.7734 3.5813 3.4198
10 9.9921 7.7272 6.4877 5.6917 5.1314 4.7127 4.3864 4.1239 3.9075 3.7256
11 10.9927 8.4791 7.1021 6.2171 5.5939 5.1281 4.7649 4.4728 4.2320 4.0296
12 11.9933 9.2307 7.7159 6.7418 6.0555 5.5424 5.1424 4.8205 4.5552 4.3322
13 12.9938 9.9821 8.3294 7.2660 6.5165 5.9560 5.5189 5.1672 4.8773 4.6336
14 13.9943 10.7333 8.9426 7.7897 6.9770 6.3690 5.8948 5.5132 5.1985 4.9341
15 14.9946 11.4844 9.5555 8.3132 7.4370 6.7814 6.2700 5.8584 5.5190 5.2338
Algunos (suelto) justificación acerca de la aproximación. Para quienes están familiarizados con la estadística
la física, esto está relacionado con un disco duro de la barra (unidimensional) de gas, más de un espacio discreto,
con la distancia entre consecutivos particules como variables, y la (asympotical)
la equivalencia de dos "conjuntos": el original tiene volumen fijo (m) y el número de partículas (k)
(que correspondería a un "canónica" ensemble), la segunda mantiene el número de partículas
pero el volumen puede variar (sería un isobárica de conjunto), pero tales que la media
el volumen es igual al volumen fijo de la original. La condición de que las configuraciones
el original conjunto tienen la misma probabilidad está relacionada con un sistema sin interacción
energía (a excepción de la exlusion), y que corresponde (en el segundo conjunto) a un
de partículas que pueden aparecer en cada celda con una probabilidad independiente de la de sus vecinos: y a partir de aquí tengo el geométrico.
En otros términos, la equivalencia puede ser justificado en que el segundo modelo probalistic
es igual a la primera si acondicionado, en el caso de que las variables que se suma a a $m$ -
y asintóticamente tenemos menos probabilidades de pasar de este caso.
Todo esto no ofrecer una rigurosa prueba, por supuesto. También se podría argumentar que esta
tipo de aproximación al "conjunto de equivalencia" es plausible para el cómputo de la típica
estadística magnitudes que son en su mayoría relacionados con los promedios, pero aquí estamos de computación
el valor extremo, es menos claro que se debe trabajar.
Añadido: Algunas aclaraciones sobre el método de aproximación:
Recordemos que ${\bf x}=\{x_i\}$ , $i=1\cdots k$ es nuestra original discreto de la variable aleatoria; apoyo está restringido por $x_i\ge 1$$\sum x_i = m= n+k$. Dentro de esta región, todas las realizaciones tiene la misma probabilidad, por lo que la función de probabilidad es constante:
$P({\bf x}) = \frac{1}{Z}$
( $Z(n,k)$, la "función de partición", sería el recuento de todas las configuraciones posibles, pero eso no importa aquí).
Por otro lado, la propuesta de ${\bf y}=\{y_i\}$ ha iid geométrica de los componentes, con el parámetro $p=k/m$, por lo que su función de probabilidad es
$\displaystyle P({\bf y}) = \prod p (1-p)^{y_i} = p^k (1-p)^{\sum y_i}$
con $y_i \ge 1$. Llamar a $ s({\bf y})=\sum y_i$, es fácil ver que si nos condición en $s = m$, obtenemos la distribución original (que es constante, y en la misma región).
$P({\bf y} | s = m ) = P({\bf x})$
Estamos interesados en $E[g({ \bf x})]$ donde $g({\bf x}) = max(x_1 \cdots x_k)$, y quiere ver si puede ser aproximada por $E[g({\bf y})]$ (un poco floja la notación aquí)
$\displaystyle E[g({\bf y})] = \int g({\bf y}) P({\bf y}) dy = \int g({\bf y}) \sum_s P({\bf y} | s) P(s) dy $
Ahora, debido a la forma en que elegimos $p$,$E(s)=m$, y podemos esperar que $P(s)$ será muy alcanzó su punto máximo alrededor de ese valor (para mostrar que la estadística de conjuntos -canonnical, microcanonical, grand-canónica, etc - son asympotically equivalentes, se utiliza esta línea de razonamiento ). Y así, asympotically, podemos esperar ser justificado en aproximado de la suma por la que solo término. Lo que significaría que
$E[g({\bf y})] \approx E[g({\bf x})]$