Estoy tratando de crear un modelo de regresión para esta variable ( Y
) basado en 2 variables categóricas. Por lo tanto, he creado variables ficticias para sustituirlas. Estas variables ficticias (es decir int_collab, Q1,Q2,Q3
) tienen valores de 1 y 0.
Y
es un doble, con valores que van de 0 a 348,19, y alrededor del 10% tiene valores de 0. Sigue la distribución de Poisson.
Pero, cuando lo modele:
glm(Y ~ int_collab + Q1 + Q2 + Q3, data = capdata,
family=poisson(link="log"))
El valor del AIC es INF. ¿Supongo que algo está mal? ¿Es porque se supone que no debo usar Poisson para modelar esta variable?
He estado leyendo en internet, pero me ha confundido aún más. Parece que debería considerar el uso de la Binomial Negativa o la Cuasi Poisson (ya que la varianza es mayor que la media), etc... Cualquier indicación sobre qué distribución sería más adecuada sería muy apreciada.
1 votos
Y es un indicador llamado FWCI. Se calcula tomando la relación entre las citas de una publicación con el número medio de citas recibidas por todas las demás publicaciones similares. Intento ver si alguno de los predictores (calidad de la revista ~ cuartil 1 a cuartil 4 y colaboración internacional) tiene algún efecto sobre este FWCI.