5 votos

Método fiable para determinar anormal de los valores estadísticos

Estoy buscando un método estadístico para determinar si un jugador está haciendo trampa en un juego online. El juego es un Quake3 como juego (ego-shooter).

Dado un número de puntos positivos y un número de puntos negativos por jugador (puntuación) y n dado a los jugadores (n<=64).

La puntuación se une como este (positivo/negativo visto de anti-cheat-perspectiva):
positivo = número de veces que el jugador murió a sí mismo
negativo = número de enfrente jugadores del equipo muerto


Adicional los valores disponibles:
t = Tiempo en que este resultado se ha logrado
c = número de número de jugadores
m = número de veces que un jugador matado a alguien del mismo equipo (teamkiller, muy negativo si es mayor a 1 o 2, durante un período de 15 minutos)

Cada jugador puede engañar independientes el uno del otro.

He utilizado la desviación estándar (en el valor de v = (negativo+1)/(positivos+1) por jugador, la asignación de sobrepasar el límite de 3 veces la desviación estándar con certeza absoluta (100%) de la trampa - a pesar de que mi experiencia ha sido que exceda de stddev por sí sola no sería suficiente en la mayoría de los casos), que funciona muy bien en un solo jugador, pero falla miserablemente tan pronto como varios jugadores que hacen trampa al mismo tiempo. También la práctica de la definición de 3 veces stddev como 100% permite > 100% de probabilidades. Por desgracia, el porcentaje de los jugadores de hacer trampa en un sin filtrar juego es de aproximadamente un 70 a un 80 por ciento o incluso más, si la contabilidad para obtener más sutil de los tramposos.

Una cosa más a tener en cuenta es, si hay un grupo de gente que engaña, y uno que no lo es, la distribución ya no es una distribución normal, pero un camello-bump como de distribución. Es allí cualquier útil algoritmo o fórmula para este problema ?

2voto

J Wynia Puntos 4679

El uso de la stddev indica que mirar a cada variable por separado. Si nos fijamos en ellos juntos, podrían tener más posibilidades. Un valor atípico en una dimensión puede ser coincidencia, un valor atípico en más dimensiones es mucho más probable que una anomalía. No sé mucho acerca de los juegos, pero creo que usted podría utilizar encontrar más variables como la distancia recorrida en el juego y así sucesivamente.

Puede utilizar la teoría de valor extremo para la detección de anomalías. Una muy ingenua manera de mirar de los valores extremos es el uso de la distancia de mahalanobis. Esta es una medida que toma en cuenta la difusión de sus datos, y calcula la distancia relativa desde el centro. Será menos sensible a los valores atípicos en una estadística, pero puede ser visto como una manera de encontrar a los jugadores donde la combinación de las estadísticas es impar.

Un enfoque similar es la construcción de un modelo y echar un vistazo a los términos de error. Este es esencialmente el mismo: se ve a los jugadores que no encajan en el patrón general. Es una técnica que también se utiliza en servicios financieros a encontrar los casos de fraude. El modelo puede ir desde básico de un modelo lineal para los modelos más complejos. Si usted aplica su algoritmo a los términos de error del modelo ajustado sin jugador que, básicamente, calcular algo similar a Cocinar la distancia de un determinado jugador. En combinación con el DFFITS medida y el apalancamiento, es a menudo utilizado para la detección de valores atípicos y/o influyentes puntos en la regresión.

Usted podría también utilizar una clasificación supervisada: Se entrena un algoritmo con genuina de los jugadores y conoce los tramposos. Hay una gran cantidad de técnicas disponibles, a partir de las redes neuronales y árboles de clasificación para máquinas de vectores soporte y bosques aleatorios.

Los algoritmos genéticos se utilizan más y más así, como se puede progresar en el conocimiento cuando pasa el tiempo. Si usted comprobar el supuesto de tramposos, podría se parece mucho a un filtro de spam - corregir el mal clasificadas jugadores. El algoritmo continuamente aprender a predecir mejor cuando un jugador es un tramposo.

Como mbq mencionado, sin datos de ejemplo es imposible darle un algoritmo; yo no sé ni en qué tipo de medidas se puede trabajar. Pero esto debe darle algunas ideas acerca de la multitud de los métodos disponibles, desde muy ingenuo bastante complejo. Se puede aprender mucho de detección de fraude si a usted le gusta a google un poco más.

Un motor de arranque podría ser este artículo de Wheeler y Aitken. Otra interesante visión general de las posibles técnicas se encuentra en este artículo por Kou et al (enlace alternativo para publicación)

0voto

David Joyner Puntos 4994

Voy a volver a publicar la respuesta que me dieron en las matemáticas.stackexchange:

Tu pregunta tiene algo más de información:

¿Cómo es su puntuación generada (¿qué tipo de juego es)? Lo que debe a su no-trampa de datos? ¿Cómo las personas se engañan? Cómo será su puntuación de ser diferente (en el sentido estadístico) cuando no están engañando? ¿Sabes aproximadamente la proporción de los que están engañando? O es que algo que usted también quiere averiguar?

Miramos también a la detección de valores atípicos algoritmos: wikipedia parece útil sobre este tema (enlace). El uso de un Q-Q plot en los datos también pueden ser útiles si no la trampa de datos debe ser de aproximadamente una distribución normal; los puntos que están significativamente por encima de la línea podría ser tramposos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X