Métodos
A partir de la url de la base http://www.cross-tables.com/annotated.php?a=1 he utilizado una combinación de Python urllib
, multiprocessing
y BeautifulSoup
a la extracción de los primeros 10000 juegos. Los juegos se analiza y se convirtió en numpy
15x15 matrices Booleanas. Las matrices se convirtió entonces en los gráficos de hacer un borde si dos células adyacentes en la matriz de ambos activos. Propiedades de gráfico, se analizaron con networkx
De los 10000 juegos, sólo 9966 eran utilizables. Algunos juegos no se inició en el centro de título, mientras que otros se terminó tan rápidamente y, por extraño que no se comportan correctamente. Afortunadamente, estos juegos eran bastante raras que el ejemplo debe dar una estimación robusta de la verdad de las distribuciones.
Métodos (Actualización)
Hubo un poco más de datos de limpieza necesarios. No me había tomado en consideración, impugnó, que lleva a los juegos que había >100 azulejos utilizados. En el proceso, me observó movimiento en falso y falso juegos. Puede que tengamos que vivir con un poco de incertidumbre en los datos, como es el costo de la verdadera datos empíricos.
Resultados
La primera pieza interesante de la información de la junta de frecuencia proporciona una buena espacial de conexión a los gráficos que vamos a estudiar. Observe que, debido a cómo se juega el juego (y cómo se lee de izquierda a derecha y de arriba a abajo) la junta directiva es asimétrica.
A partir de aquí podemos responder a la pregunta,
"¿Cuál es la distribución de gráfico de diámetros y radios para un promedio de
Scrabble juego?"
Un gráfico de dispersión versus el tamaño de la gráfica revela un poco más de información para los más pequeños de $N$ valores:
Resultados (Actualización)
Basándose en un comentario, he trazado la radio vs el diámetro, dando principalmente una relación lineal de 1 a 2, excepto para una amplia gama de juegos con algunas variaciones. Siéntase libre de hacer algunas observaciones sobre la importancia de esta en los comentarios.
Rápida Conclusión (TLDR)
A partir de los datos estudiados, no eran en su mayoría lleno de juegos jugados ~100 azulejos con un promedio gráfico de radio de 18 años y un diámetro de 36. Es necesario seguir trabajando para comparar estos resultados con los grafos aleatorios con el mismo tamaño y el borde de la cuenta, pero diferentes borde de la distribución.