8 votos

La medición de los efectos de los factores sobre el binomio resultado con muchos grupos

Me gustaría hacer algunos análisis de disparo de la eficiencia en el baloncesto cuando un equipo es líder (por DELANTE) o al final (por DETRÁS), por menos de 8 puntos y si son en CASA o FUERA de ella. Aquí están algunos ejemplos de los datos:

Ray Allen   HOME    BEHIND  59.4%   134
Ray Allen   HOME    AHEAD   57.13%  132
Ray Allen   AWAY    BEHIND  49.1%   166
Ray Allen   AWAY    AHEAD   48.03%  126
Jason Terry AWAY    BEHIND  56.6%   242
Jason Terry HOME    BEHIND  52.0%   193
Jason Terry AWAY    AHEAD   50.05%  198
Jason Terry HOME    AHEAD   48.73%  207
Jamal Crawford  AWAY    AHEAD   51.65%  82
Jamal Crawford  HOME    AHEAD   42.50%  178
Jamal Crawford  AWAY    BEHIND  35.5%   129
Jamal Crawford  HOME    BEHIND  33.4%   118
Kevin Durant    HOME    BEHIND  48.6%   222
Kevin Durant    HOME    AHEAD   44.05%  248
Kevin Durant    AWAY    BEHIND  41.4%   325
Kevin Durant    AWAY    AHEAD   40.07%  213

La 4ª columna es el FG% (es decir, la proporción de vacunas) y la 5ª columna es el número de disparos (es decir, ensayos).

Se puede ver incluso con estos 4 jugadores (y hay aproximadamente 200 en el conjunto de datos), que no hay variación de la media del FG% entre los jugadores, y para cada jugador, no hay un patrón consistente en si son "mejores" en CASA o FUERA o por DELANTE o por DETRÁS. Así que hay una gran cantidad de variación entre grupos dentro de los grupos como de lo que puedo decir.

Pensé acerca del uso de lmer, pero yo no estaba seguro de cómo hacer que este problema, porque si yo sólo uso el FG% como el resultado, voy a perder la información acerca de cómo muchas fotos fueron tomadas. Finalmente, me gustaría poner esto en ERRORES, pero pensé que podría haber una forma más sencilla y directa, por ahora, porque no estoy preparada para eso todavía.

Solo debo agregar que lo que yo soy realmente después es una manera de determinar si un jugador es "realmente" el mejor bajo una de estas condiciones, o son las aparentes diferencias debido al ruido/variación de tamaños de muestra pequeños.

Gracias por cualquier consejo.

1voto

jubo Puntos 626

Para eludir los 200 jugadores problema, podría encajar en cualquier modelo que usted elija (logit binomial...), sin que el jugador de la variable como tal, pero dentro de un discreto mezcla de marco. Usted tendrá que procesar los datos a la derecha (por ejemplo, usted quiere asegurarse de que todas las estadísticas de un solo jugador se toman juntos, y usted tendrá que determinar el número óptimo de clusters en la mezcla), pero el conjunto de la mezcla de modelo del grupo de jugadores en grupos, que deben reflejar las diferencias en el rendimiento, o más bien las diferencias en cómo las condiciones (de la casa y por delante) afectan al rendimiento. Esto es muy fácil y rápido con paquete R flexmix.

Edificio en la misma idea, también se puede simplemente ejecutar un unsupervized agrupación de algo (k-means, gauss mezcla, mapa de auto-organización) sobre los datos transformados como tal: cada jugador tiene un vector de 8 valores de $(rate_{home,lead}, N_{home, lead}, rate_{home, behind}, N_{home, behind}, ...)$. En ese caso cada jugador pertenece a un grupo de jugadores con características similares, y usted puede comprobar si las diferencias entre los grupos son significativas.

0voto

mat_geek Puntos 1367

Creo que se podría ajustar un modelo de regresión logística utilizando player, por delante/detrás, en casa/fuera, el porcentaje de éxito y el número de fotografías tomadas en esas condiciones posibles covariables. A continuación, la dificultad con el jugador que tiene más de 200. Creo que el porcentaje de éxito en determinadas condiciones podría servir como un sustituto para el jugador, ya que el jugador y su rendimiento en el pasado en las condiciones deben estar altamente relacionada con el resultado. Para predecir para los jugadores individuales usted sólo tiene que utilizar ese jugador de otras covariables.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X