Actualmente estoy llevando a cabo una investigación para encontrar si ciertos factores como jugar en casa o fuera o la posición de un futbolista afecta a la finalización de pases en general utilizando la regresión logística. Estoy utilizando R para calcular mis datos. En mi sección actual en la que estoy tratando de analizar utiliza los datos de cada jugador para transmitir una conclusión general de si la posición de un jugador afecta o no a la finalización de pases con éxito.
hasta ahora he calculado:
test.logit <- glm( cbind(Total.Successful.Passes.All,Total.Unsuccessful.Passes.All) ~
as.factor(Position.Id), data=passes.data, family = "binomial")
summary(test.logit)
y mi salida fue:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.28482 0.01256 22.67 <2e-16
as.factor(Position.Id)2 0.99768 0.01438 69.38 <2e-16
as.factor(Position.Id)4 1.06679 0.01398 76.29 <2e-16
as.factor(Position.Id)6 0.68090 0.01652 41.23 <2e-16
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 32638 on 10269 degrees of freedom
Residual deviance: 26499 on 10266 degrees of freedom
AIC: 60422
Number of Fisher Scoring iterations: 4
la intercepción es para los porteros, la posición 2 es para un defensa, 4 = centrocampista y 6 = delantero
¿Es este un buen conjunto de resultados para llegar a una conclusión? y con las grandes desviaciones?