Un lugar natural para empezar, dependiendo de su formación matemática, podrían ser las generalizaciones cardinales modernas de la literatura sobre la votación. Considera el siguiente modelo de juguete, y siéntete libre de adaptar cualquier parte que no parezca apropiada para el problema en cuestión.
Datos : Digamos que tenemos una población fija y finita de jugadores $N$ que observamos jugar. Una única observación consiste en el resultado de un único partido entre dos jugadores $\{i \succ j\}$ para algunos $i,j \in N$ . Sea el espacio de los conjuntos de datos $\mathcal{D}$ consiste, para los fijos $N$ de todas las colecciones finitas de tales observaciones.
Concepto de solución : Nuestro objetivo aquí es doble: matemáticamente vamos a tratar de obtener un vector en $\mathbb{R}^N$ cuyo $i^\textrm{th}$ es la "medida del jugador $i$ en relación con todos los demás". Un jugador $i$ es mejor que el jugador $j$ por nuestra regla si el $i^\textrm{th}$ de este vector de puntuación es mayor que el $j^\textrm{th}$ . También nos gustaría que la magnitud de las diferencias en estos componentes fuera creciente en alguna medida de la diferencia de habilidades por pares (el vector de puntuación es cardenal para usar la jerga económica).
Editar : Este vector de puntuación no debe verse como una medida de la suerte frente a la habilidad. Pero lo que sí podremos hacer es utilizarlo para "limpiar" nuestros datos del componente generado por las diferencias de habilidad, dejando un residuo que podremos interpretar como "el componente de los resultados atribuible a la suerte". En particular, este "componente de suerte" vive en un espacio normalizado, y por lo tanto viene con un medio natural de medir su magnitud, que parece ser lo que usted busca.
Nuestro enfoque va a utilizar una generalización cardinal de algo conocido como el recuento Borda de la teoría del voto.
Agregación : Nuestro primer paso es agregar nuestro conjunto de datos. Dado un conjunto de datos, consideremos lo siguiente $N\times N$ matriz que lo "codifica". Para todos los $i,j \in N$ definir:
$$ D_{ij} = \frac{\textrm{Number of times $ i $ has won over $ j $}- \textrm{Number of times $ j $ has won over $ i $}}{\textrm{Number of times $ i $ and $ j $ have played}} $$
si el denominador es distinto de cero, y $0$ otra cosa. El ${ij}^\textrm{th}$ de esta matriz codifica la frecuencia relativa con la que $i$ ha vencido a $j$ . Además, $D_{ij} = -D_{ij}$ . Por lo tanto, hemos identificado este conjunto de datos con una simetría sesgada, de valor real $N\times N$ matriz.
Una forma equivalente de ver estos datos es como un flujo en un gráfico cuyos vértices corresponden al $N$ jugadores (todo flujo en un gráfico tiene una representación como matriz sesgada-simétrica y viceversa). En este lenguaje, un candidato natural para un vector de puntuación es un función potencial una función de los vértices a $\mathbb{R}$ (es decir, un vector en $\mathbb{R}^N$ ) tal que el valor del flujo en cualquier arista viene dado por su gradiente. En otras palabras, nos preguntamos si existe algún vector $s \in \mathbb{R}^N$ tal que, para todo $i,j \in N$ :
$$ D_{ij} = s_j - s_i. $$
Esto podría percibirse de forma muy natural como una métrica del "talento" dado el conjunto de datos. Si existiera un vector de este tipo, indicaría que las diferencias de habilidad podrían "explicar toda la variación de los datos". Sin embargo, por lo general, para una matriz de datos agregados dada, tal función potencial no suele existir (como esperaríamos, de acuerdo con nuestra interpretación).
Editar : Hay que tener en cuenta que la forma en que estamos agregando los datos (contando las victorias relativas) generalmente impedirá que exista tal función, incluso cuando el juego esté "totalmente determinado por la habilidad". En estos casos, nuestra $D$ tomará valores exclusivamente en $\{-1, 0 ,1\}$ . Siguiendo el enfoque que se expone a continuación, se obtendrá una función de puntuación que racionalice esta ordenación, pero el residuo no será necesariamente cero (sino que generalmente adoptará una forma específica, de un $N$ -ciclo de flujo conservador que pasa por cada vértice). Si se utilizara, por ejemplo, la puntuación de las partidas, los datos agregados tendrían una interpretación cardinal.
Construcción de una puntuación : La buena noticia es que existen las herramientas matemáticas para construir una función de puntuación que sea, en un sentido riguroso, el "mejor ajuste para los datos", incluso si no es una coincidencia perfecta (piense en cómo una nube de puntos de datos rara vez cae perfectamente en una línea, pero sin embargo podemos encontrar instructivo encontrar la línea que es el mejor ajuste para ella). Dado que esto se ha etiquetado como una pregunta blanda, me limitaré a dar un esbozo de cómo y por qué se puede construir dicha puntuación. El espacio de todas esas matrices de datos agregados admite en realidad una descomposición en el subespacio lineal de los flujos que admiten una función potencial, y su complemento ortogonal. Formalmente, se trata de una versión combinatoria de la descomposición de Hodge de la cohomología de Rham (pero si esas palabras no significan nada, no te preocupes por buscarlas). Entonces, hablando en términos generales, en el espíritu de la regresión clásica, podemos resolver un problema de minimización de mínimos cuadrados para proyectar ortogonalmente nuestra matriz de datos agregados en el subespacio lineal de los flujos que admiten una función potencial:
$$ \min_{s \in \mathbb{R}^N} \|D - (-\textrm{grad}(s))\|^2 $$ donde $-\textrm{grad}(s)$ es un $N\times N$ matriz cuya $ij^\textrm{th}$ elemento es $s_i - s_j$ .
Si está interesado en ver este enfoque utilizado para construir una clasificación de equipos de fútbol universitario, vea:
http://www.ams.org/samplings/feature-column/fc-2012-12
Si quiere leer un poco más sobre la maquinaria que subyace a esto, incluyendo una breve lectura sobre las conexiones con la literatura matemática de la votación, vea:
https://www.stat.uchicago.edu/~lekheng/meetings/mathofranking/ref/jiang-lim-yao-ye.pdf
0 votos
Una respuesta sencilla y aburrida: cuanto más dinero te lleves, mejor serás en el póker. Del mismo modo, si ganas todas las partidas de una duración razonable (por ejemplo, 9 puntos), eres el mejor jugador de backgammon.
0 votos
@badjohn No estoy pidiendo una forma de clasificar a los jugadores. Un sistema de clasificación Elo puede hacer el trabajo allí. Estoy interesado en una métrica que muestre cuánta habilidad vs. suerte tiene un juego. Mi título puede ser engañoso, lo actualizaré.
0 votos
Sí, pero si un jugador gana sistemáticamente a otro, eso demuestra que hay un elemento de habilidad. Deberías poder encontrar una prueba estadística para comparar el resultado con la hipótesis nula de que no hay habilidad.
0 votos
Aquí hay un vídeo que explica el análisis básico del libro "La ecuación del éxito". youtube.com/watch?v=HNlgISa9Giw Por lo que veo, sufre el mismo problema que describo en la pregunta. Sólo tiene en cuenta a los jugadores de alto nivel y, por tanto, la métrica de suerte frente a habilidad no es realmente indicativa del juego en su conjunto.