No estoy seguro de que la mejor manera de redactar esta pregunta, pero voy a darle una oportunidad.
Si tuviera que elegir al azar los números enteros entre 1 y $n$ un número significativo de veces con respecto a la $n$ (es decir, $m$ donde $m$ es algo así como el 70% de % de$n$) y, a continuación, miró a la distribución de frecuencias de los resultados, creo que podría tener una distribución que no era plana. I. e. un número muy pequeño de los resultados vendrían >1 veces, la mayoría vienen de hasta 1 hora, y algunos de los resultados que habría de venir hasta 0 veces. Obviamente, esto sería afectada por el tamaño relativo de $m$$n$: Si yo tuviera que elegir un sólo 10 números entre 0 y 1,000,000 ($m$=10, $n$=1,000,000), yo esperaría que la gran mayoría de los números que tienen una frecuencia de 0, con el resto 1.
Tengo preguntas:
- Es esto correcto?
- ¿Cómo calcular la frecuencia esperada de los más frecuentes número elegido?
- Si usted se para ordenar los resultados según la frecuencia y, a continuación, gráfico de barras de la frecuencia, hace que la curva resultante tiene un nombre, o cualquier interesantes propiedades?
Espero que esto tiene algún tipo de sentido. Si no, hágamelo saber y voy a tratar de pensar en una mejor manera de explicarlo. Todo esto viene de una pregunta original que fue algo como esto: "Si tengo una lotería de la máquina con 15 millones de diferente número de la lotería resultado de combinaciones, dado que ya he hecho 10 millones de sorteos, ¿cuál es la probabilidad de que el 10,000,001 th sorteo ya ha sido dibujada?"
Editar:
Corrí algunas simulaciones monte-carlo para $2<n<650$, con $m$=$n$ y el número total de experimentos para cada una de las $n$ 10.000 veces y un promedio de los resultados. En que se registra la máxima frecuencia, el número de veces que un número salió el 1 de tiempo, y el número de veces que un número salga 0 veces. Dos cosas interesantes: El número de números que vienen 1 vez coincide con el calculado $n p(k)$, y esto también está cerca de la cantidad de veces que un número salga 0 veces. No estoy seguro de que es obvio que estos dos debe ser el mismo, como $p(k)$ no parece tener sentido para $k=0$ (se Puede hacer $m$ elija $0$?). También, curiosamente, en una parcela de $m$ contra el promedio de la frecuencia máxima da una curva que se parece a esto:
Obviamente algún tipo de registro de relación.
El próximo paso es modificar los $m$ como porcentaje de $n$.