6 votos

¿Cómo decido qué familia de funciones de varianza/vínculo utilizar en un modelo lineal generalizado?

Estoy a punto de utilizar la función glm() en R, y sé que tengo que especificar qué familia de funciones de varianza/varianza quiero utilizar (ya sea gaussiana, binomial, poisson, Gamma, inversa.gaussiana, o cuasi-que entiendo que significa definida por el usuario).

Entiendo que la binomial debe usarse para cosas como la regresión logística, pero no tengo claro en qué escenarios deben usarse las otras. ¿Alguien tiene algún consejo útil?

7voto

Zizzencs Puntos 1358

Depende de la naturaleza de su variable dependiente:

Gaussian es para DV continuos (se trata de mínimos cuadrados ordinarios)

Binomial, como usted señala, es para la regresión logística .

Poisson es para datos de recuento (enteros no negativos). Véase también quasipoisson.

Gamma es para DV continua que es siempre positiva (aunque a menudo se puede utilizar Gaussiana aquí, si la media es $>> 0$ y la sd no es enorme, es decir, si todos los valores están bastante alejados de 0).

La gaussiana inversa se utiliza, creo, para datos de supervivencia (tiempo transcurrido hasta el suceso).

0 votos

Quieres decir variable independiente, ¿verdad? Y también, ¿estás diciendo que un enlace binomial se puede utilizar tanto para datos de recuento como para rasgos binarios (digamos, presencia o ausencia de una infección vírica)?

0 votos

No, me refiero a variable dependiente. No sé a qué se refiere con su segunda pregunta.

1 votos

¿Alguien conoce (o estaría dispuesto a proporcionar) una guía concisa para elegir una función de familia y enlace adecuada basada en la forma de los datos/residuos?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X