La probabilidad de que un gran $n$ $e^{-1}$ en la amistad-la fuerza del modelo. Ni siquiera puedo empezar a explicar por qué es, pero tengo una fuerte evidencia numérica. Más precisamente, si $p(n)$ es la probabilidad de que alguien, en una población de $n$ no es de nadie, mejor amigo, luego se ve fuertemente como
$$ p(n) = \Bigl(1-\frac{1}{2n-7/3}\Bigr)^{2n-7/3} + O(n^{-3})$$
como $n$ tiende a infinito.
El factor de $2$ puede ser un indicio en algunos asintótica de conexión entre los dos modelos, pero tiene que ser sutil, porque el mejor amigo de la relación, sin duda, no parece el mismo en los dos modelos: como se señaló en la pregunta, en la amistad-la fuerza del modelo hemos de esperar que la mitad de todas las personas a ser mutuamente mejores amigos con alguien, mientras que en el modelo en el que cada uno elige su mejor amigo de forma independiente, el total de número esperado de amistad mutua es sólo $\frac12$.
El desplazamiento de $7/3$ se encontró experimentalmente, pero hay buena evidencia de que es exacta. Si es que significa algo, es un misterio para mí qué.
Cómo calcular la probabilidad. Considere el grafo completo en $n$ vértices, y asignar al azar amistad pesos a cada borde. Imaginar el procesamiento de los bordes en la orden de la amistad más fuerte hacia el más débil. Para cada vértice/persona, la primera vez que vemos un borde final no va a decirle a esa persona que su mejor amigo es.
Los gráficos construimos puede llegar a ser muy complejo, pero para los propósitos de la cuenta sólo tenemos que distinguir tres tipos de nodos:
-
W - a la Espera de las personas que aún no conocen a ninguno de sus amigos. (Es decir, los vértices que no son un punto final de cualquier borde procesado todavía).
-
F - Amigos, la gente que son amigos con alguien, pero no son de nadie, mejor amigo todavía. Quizás una de las personas que Esperan que va a tener como su mejor amigo.
-
B - los Mejores amigos, que saben que tienen a alguien mejor amigo.
En cada paso en el procesamiento de la gráfica, que puede ser descrito como una triple $(w,f,b)$ indicando el número de cada tipo de nodo. Tenemos $w+f+b=n$, y el estado inicial es $(n,0,0)$ con todo el mundo sigue esperando.
- Si vemos a un WW borde, dos personas que esperan reforzarse mejores amigos, y nos movemos hacia el estado de $(w-2,f,b+2)$. Hay $w(w-1)/2$ dichos bordes.
- Si vemos un WF borde, el F nodo es ahora alguien mejor amigo y se convierte en B, y la W nodo se convierte en F. El efecto neto es que nos mueven a estado $(w-1,f,b+1)$. Hay $wf$ dichos bordes.
- Si vemos un WB borde, tne W nodo se convierte en F, pero la B queda un B -- no nos importa cómo muchas personas mejores amigos, uno es, siempre hay alguien. Nos movemos a $(w-1,f+1,b)$, y $wb$ bordes de este tipo.
- Si vemos un FF o FB o BB borde, representa una amistad donde tanto a personas que ya tienen mejores amigos, por lo que el estado no cambia.
Por lo tanto, para cada estado, el siguiente WW o WF o WB borde vemos determinar en qué estado nos movemos, y desde todos los bordes son igualmente probables, la probabilidad de pasar a los diferentes estados sucesores se $\frac{w-1}{2n-w-1}$$\frac{2f}{2n-w-1}$$\frac{2b}{2n-w-1}$, respectivamente.
Desde $w$ disminuye en cada movimiento entre los estados, podemos llenar una tabla de las probabilidades de que cada estado se han visitado alguna vez, simplemente, considerando todos los posibles estados en orden decreciente de $w$. Cuando todos los bordes se han visto estamos en un estado $(0,f,n-f)$, y sumando sobre todos estos podemos encontrar la esperada $f$ para un peso aleatorio de asignación.
Por la linealidad de la espera, la probabilidad de que un determinado nodo es F al final debe entonces ser $\langle f\rangle/n$.
Desde allí se $O(n^2)$ estados con $w+f+b=n$ y una cantidad constante de trabajo para cada estado, este algoritmo se ejecuta en el tiempo $O(n^2)$.
Los resultados numéricos. Aquí están los resultados exactos para $n$ hasta las 18:
n approx exact
--------------------------------------------------
1 100% 1/1
2 0.00% 0/1
3 33.33% 1/3
4 33.33% 1/3
5 34.29% 12/35
6 34.81% 47/135
7 35.16% 731/2079
8 35.40% 1772/5005
9 35.58% 20609/57915
10 35.72% 1119109/3132675
11 35.83% 511144/1426425
12 35.92% 75988111/211527855
13 36.00% 1478400533/4106936925
14 36.06% 63352450072/175685635125
15 36.11% 5929774129117/16419849744375
16 36.16% 18809879890171/52019187845625
17 36.20% 514568399840884/1421472473796375
18 36.24% 120770557736740451/333297887934886875
Después de este punto, exacta racional de la aritmética con 64 bits denominadores empezar a rebosar. Se vería $p(n)$ tiende a $e^{-1}$. (Por otro lado, la secuencia de los numeradores y denominadores son desconocidos para OEIS).
Para obtener más, cambié de máquina nativo de punto flotante (Intel 80 bits) y consiguió el $p(n)$ columna de esta tabla:
n p(n) A B C D E F G H
---------------------------------------------------------------------
10 .3572375 1.97+ 4.65- 4.65- 4.65- 2.84+ 3.74+ 3.64+ 4.82-
20 .3629434 2.31+ 5.68- 5.68- 5.68- 3.47+ 4.67+ 4.28+ 5.87-
40 .3654985 2.62+ 6.65- 6.64- 6.64- 4.09+ 5.59+ 4.90+ 6.84-
80 .3667097 2.93+ 7.59- 7.57- 7.57- 4.70+ 6.49+ 5.51+ 7.77-
100 .3669469 3.03+ 7.89- 7.87- 7.86- 4.89+ 6.79+ 5.71+ 8.07-
200 .3674164 3.33+ 8.83- 8.79- 8.77- 5.50+ 7.69+ 6.32+ 8.99-
400 .3676487 3.64+ 9.79- 9.69- 9.65- 6.10+ 8.60+ 6.92+ 9.90-
800 .3677642 3.94+ 10.81- 10.60- 10.52- 6.70+ 9.50+ 7.52+ 10.80-
1000 .3677873 4.04+ 11.17- 10.89- 10.80- 6.90+ 9.79+ 7.72+ 11.10-
2000 .3678334 4.34+ 13.18- 11.80- 11.63- 7.50+ 10.69+ 8.32+ 12.00-
4000 .3678564 4.64+ 12.74+ 12.70- 12.41- 8.10+ 11.60+ 8.92+ 12.90-
8000 .3678679 4.94+ 13.15+ 13.60- 13.14- 8.70+ 12.50+ 9.52+ 13.81-
10000 .3678702 5.04+ 13.31+ 13.89- 13.36- 8.90+ 12.79+ 9.72+ 14.10-
20000 .3678748 5.34+ 13.86+ 14.80- 14.03- 9.50+ 13.69+ 10.32+ 15.00-
40000 .3678771 5.64+ 14.44+ 15.70- 14.67- 10.10+ 14.60+ 10.92+ 15.91-
Los otros 8 columnas a mostrar lo bien $p(n)$ coincide con varios intentos de modelo. En cada columna muestro $-\log_{10}|p(n)-f_i(n)|$ para algunos la función de prueba de $f_i$ (es decir, cuántos dígitos de acuerdo hay entre el$p(n)$$f_i(n)$), y el signo de la diferencia entre el$p$$f_i$.
En la primera columna se compara a la constante $e^{-1}$. Es principalmente como evidencia de que $p(n)\to e^{-1}$. Más precisamente, se parece a $p(n) = e^{-1} + O(n^{-1})$ -- siempre que $n$ recibe 10 veces más grande, otro de los dígitos de $e^{-1}$ es producido.
- $f_{\tt C}(n)=\Bigl(1-\frac{1}{2n-7/3}\Bigr)^{2n-7.3}$
Me encontré con esta función mediante la comparación de $p(n)$ $(1-\frac{1}{n-1})^{n-1}$(la probabilidad de que el elegido-mejores-amigos-independientemente del modelo) y darse cuenta de que casi iguala entre $n$$2n$. El desplazamiento de $7/3$ fue encontrado por ensayo y error. Con este valor se parece a $f_{\tt C}(n)$ aproxima $p(n)$ a $O(n^{-3})$, dado que la $n$ 10 veces más grande da tres dígitos adicionales de acuerdo.
- $ f_{\tt B}=\Bigl(1-\frac{1}{2n-2.332}\Bigr)^{2n-2.332}$ $f_{\tt D}=\Bigl(1-\frac{1}{2n-2.334}\Bigr)^{2n-2.334} $
Estas columnas proporcionan evidencia de que la $7/3$ $f_{\tt C}$ es probable para ser exactos, ya que varían sólo ligeramente en cada dirección da claramente peor aproximación a $p(n)$. Estas columnas no llegan a alcanzar más de tres dígitos de precisión para cada década de $n$.
- $ f_{\tt E}(n)=e^{-1}\bigl(1-\frac14 n^{-1}\bigr)$ $f_{\tt F}(n)=e^{-1}\bigl(1-\frac14 n^{-1} - \frac{11}{32} n^{-2}\bigr)$
Dos y tres términos de la expansión asintótica de $f_{\tt C}$ en $n$. $f_{\tt F}$ también mejora la cubically, pero con un mucho mayor error de $f_{\tt C}$. Esto parece indicar que la estructura específica de $f_{\tt C}$ es importante para el ajuste, en lugar de sólo los primeros términos en su expansión.
- $ f_{\tt G}(n)=e^{-1}\bigl(1-\frac12 (2n-7/3)^{-1}\bigr)$ $f_{\tt H}(n)=e^{-1}\bigl(1-\frac12 (2n-7/3)^{-1}-\frac{5}{24} (2n-7/3)^{-2}\bigr) $
He aquí una sorpresa! La expansión de $f_{\tt C}$ en potencias de $2n-7/3$ en lugar de potencias de $n$ no sólo da mejores aproximaciones de $f_{\tt E}$$f_{\tt F}$, pero también se aproxima a $p(n)$ mejor que el $f_{\tt C}$ sí no, por un factor de alrededor de $10^{0.2}\approx 1.6$. Esto parece ser aún más misterioso que el hecho de que $f_{\tt C}$ partidos.
En $n=40000$ el cálculo de $p(n)$ toma alrededor de un minuto, y las comparaciones de comenzar a empujar el límite de equipo de punto flotante. El 15-16 dígitos de precisión en algunas de las columnas son apenas representable en doble precisión. Curiosamente, el cálculo de $p(n)$ sí parece ser bastante robusto en comparación con las aproximaciones.
0 votos
Me pregunto cómo se verían los datos de Facebook sobre esto, donde "mejor amigo" sería definido como "persona con la que más se interactúa en Facebook". Por supuesto, esto no tiene nada que ver con tu modelo.
1 votos
OT: esto me recuerda a la tira de Peanuts donde todos venían con un montón de tarjetas de San Valentín, y al final el único que no recibió una tarjeta fue Charlie Brown :-)
0 votos
No mencionas qué distribución utilizas para las fortalezas de la amistad: ¿las asignas de forma uniforme e independiente de $[0, 1]$? (Si es así, ¿no sería más realista una distribución en declive pronunciado, como exponencial o de ley de potencias?)
3 votos
@ShreevatsaR: Dado que solo importa el orden relativo entre las fortalezas de la amistad, cualquier distribución continua servirá. O, de manera equivalente, se puede elegir un orden total de los $n(n-1)/2$ bordes de manera uniforme entre todos los órdenes.
0 votos
Oh, ya veo. ¡Esa es una perspectiva útil, gracias!
0 votos
Me recuerda al teorema de Ramsey.
0 votos
@HenningMakholm Por curiosidad, ¿dirías que el acuerdo con $ f (n) $ es inusualmente bueno, o simplemente apunta a una expansión asintótica de la forma $ p (n) = e ^ {-1} (1 - 1/4n + O (1/n^2)) $?
2 votos
@ErickWong: Mis datos numéricos (a más dígitos de los que he citado aquí) parecen coincidir hasta $o(n^2)$, por lo que ambos términos $n^{-1}$ y $n^{-2}$ de la expansión asintótica coinciden. Podría seguir siendo una coincidencia, por supuesto, pero parece menos probable porque el polinomio $2n-7/3$ tiene menos coeficientes que el número de términos en la expansión asintótica que parecen coincidir.