7 votos

Previsión de técnicas de optimización de béisbol de la fantasía

Actualmente estoy tratando de construir un mejor modelo de predicción para mi béisbol de la fantasía de la lista. Yo actualmente estoy usando comúnmente aceptado proyectado temporada de estadísticas (Cremalleras de Fangraphs) para determinar el promedio de la fantasía de puntos que un jugador puede esperar que contribuyen al juego. Esto es problemático, sin embargo, debido a que no toma en cuenta la varianza en el rendimiento de los jugadores (entre otras cosas).

Desde el béisbol implica tanto la suerte y la habilidad, no creo que es un ejercicio útil para intentar predecir cualquier estadística en particular de un juego (es decir, la cantidad de visitas a Prince Fielder tendrá). En su lugar, me gustaría proyecto de punto de media contribuciones, pero tomar la varianza en cuenta al hacerlo.

La primera cosa que viene a la mente es el efecto de la oposición lanzador. Mi hipótesis es que la calidad de la jarra efectos opuestos del rendimiento de los jugadores. Dadas dos jugadores para elegir, que son relativamente iguales en proyecta la fantasía de punto medias, ¿cómo puedo cuantificar el efecto de la oposición jarra y cómo puedo probar la hipótesis?

También, ¿puedo considerar que la varianza en una forma razonable, aunque es incierto? ¿Cómo puedo realmente saber si mi proyecciones están rindiendo más o menos? (Este parece ser similar a la de una cartera financiera problema de optimización)

0voto

Tyler Puntos 21

Corriendo con su ejemplo de escoger entre dos jugadores dado el conocimiento de la otra jarra, creo que se podría construir una razonable modelo de uso de datos históricos para simular los resultados. Por ejemplo, supongamos que usted está decidiendo si se debe iniciar Un Jugador o Jugador B. el Jugador a es un 31 años de edad de RH bateador frente a un RH pitcher que es el as en su equipo de la rotación. Usted podría crear una muestra de observaciones de la fantasía de los puntos de Un Jugador genera cuando se enfrentó a una fuerte RH pitcher de los últimos 200 juegos. Por ejemplo, Un Jugador puede haber enfrentado 30 mejores clasificados RH lanzadores en los últimos 200 juegos, por lo que tendría de 30 tipos diferentes de fantasía punto de observaciones en la muestra. 200 es totalmente arbitrario, usted podría utilizar más o menos la historia dependiendo de cuánto de Un Jugador de la historia de sentir está relacionada a su desempeño reciente. El más historia, más juegos que coinciden con las especificaciones de la muestra, pero algunos de los juegos que podrían no ser aplicables a Un Jugador de habilidad actual. Usted podría también utilizar otros jugadores que son comparables con el Jugador a habilidades, estilo de bateo, y la edad para aumentar el número de observaciones en la muestra. Nate Silver habla sobre el uso de comparables a los jugadores en su libro La Señal y el Ruido. Además, se podría refinar los juegos de agregar a la muestra basándose en el estadio el juego se juega en (hitters parque v. lanzadores parque), el clima (viento que sopla en o fuera), el punto en la temporada (temprana, media, tardía), el tipo y la frecuencia de los lanzamientos del pitcher lanza, la calidad del equipo del bullpen, ect...Que podría hacer que la muestra como específicos y que te gusta, aunque usted podría terminar con sólo un par de observaciones que disminuiría la utilidad de la simulación de los resultados.

Una vez que se tiene una muestra de juegos para dibujar, puedes crear una distribución de la fantasía de los puntos que el Jugador a podría generar por el arranque de las observaciones. Si usted repite este mismo proceso para el Jugador B y el cántaro se enfrenta usted tendrá dos distribuciones de la fantasía de los puntos que cada jugador es probable que se generen en el próximo juego. Usted puede comparar las dos distribuciones que utilizan métodos estadísticos para la comparación de dos medias (t-test para distribuciones normales, la prueba de Mann-Whitney para los no-normal). Si se comparan varios jugadores que tendría que utilizar métodos para la comparación de más de dos medios. Tan lejos como el seguimiento del rendimiento de sus proyecciones, los p-valores que se derivan de la comparación de medias equivale a la probabilidad de que usted podría esperar a que el jugador con menor proyecta la fantasía puntos para superar el jugador con mayor proyectado puntos. Si usted hace 10 proyecciones, cada que tenía un 10% p-valor cuando se hizo la media de comparación, a continuación, usted debe esperar para obtener alrededor de las 9 de estas proyecciones derecho. Si usted está recibiendo un montón más proyecciones mal, entonces el p-valor de la media de las comparaciones sugieren que algo podría estar mal.

Este es un método de fuerza bruta para comparar a dos jugadores y se basa en gran medida en datos históricos, pero siempre se puede construir en algunos factores de ajuste para ajustar el final de las distribuciones basadas en el dominio específico de conocimiento. Por ejemplo, tal vez usted sabe que el jugador que batea a la derecha antes de que el Jugador está en la lista de distribución y su reemplazo no es tan buena en llegar a la base. Esto probablemente va a dificultar Un Jugador RBI de la producción, así que tal vez usted quiere cambiar la distribución muestral de Un Jugador que se espera de la fantasía de los puntos a la izquierda para dar cuenta de la probabilidad de que el Jugador a la fantasía de la generación de puntos será menor debido a una menor RBI potencial. Incluso se podría estimar este factor de ajuste de los datos. Con todo, hay un montón de cosas que usted puede hacer por arranque de los resultados históricos que usted piensa que son representativos de los juegos que usted está interesado en la comparación de las distribuciones resultantes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X