La premisa es esta cita de la viñeta del paquete R betareg
1 .
Además, el modelo comparte algunas propiedades (como la linealidad predictor, función de enlace, parámetro de dispersión) con el generalizados (GLMs; McCullagh y Nelder 1989), pero no es un caso especial de este marco (ni siquiera para la dispersión fija)
Esta respuesta también hace alusión al hecho:
[...] Este es un tipo de modelo de regresión que es apropiado cuando el variable de respuesta se distribuye como Beta. Se puede pensar en él como análogo a un modelo lineal generalizado. Es exactamente lo que está buscando [...] (el énfasis es mío)
El título de la pregunta lo dice todo: ¿por qué la regresión Beta/Dirichlet no se consideran modelos lineales generalizados (no lo son)?
Hasta donde yo sé, el Modelo Lineal Generalizado define modelos construidos sobre la expectativa de sus variables dependientes condicionadas a las independientes.
f es la función de enlace que mapea la expectativa, g es una distribución de probabilidad, Y los resultados y X los predictores, β son parámetros lineales y σ2 de la varianza.
f(E(Y∣X))∼g(βX,Iσ2)
Diferentes GLMs imponen (o relajan) la relación entre la media y la varianza, pero g debe ser una distribución de probabilidad de la familia exponencial, una propiedad deseable que debería mejorar la robustez de la estimación si no recuerdo mal. Sin embargo, las distribuciones Beta y Dirichlet forman parte de la familia exponencial, así que me he quedado sin ideas.
[1] Cribari-Neto, F., & Zeileis, A. (2009). Regresión beta en R.
2 votos
(+1) Relacionado: stats.stackexchange.com/a/189196 .
0 votos
@amoeba Gracias por el enlace, no había visto esa pregunta.
2 votos
I piense en la cuestión es que mientras que si se escribe la distribución beta con la norma a , b parámetros (por ejemplo a=b=1 implica uniforme(0,1)), entonces la distribución beta está en la familia exponencial, si se escribe en términos de μ (media) y ϕ (dispersión), no lo es. Pero nunca me ha importado tanto si una distribución es de la familia exponencial.
0 votos
@CliffAB Después de leer los comentarios bajo la respuesta de Tim, parece que la parametrización de la Beta conduce a la no ortogonalidad de los parámetros, que parece ser un requisito para los GLM de McCullagh-Nelder.
0 votos
No todas las distribuciones exponenciales entran en el marco del GLM (Weibull, por ejemplo). Mi mejor opinión es que esto se debe a que no se puede reescribir la función de distribución de la distribución Beta utilizando la fórmula de la familia exponencial univariante es.wikipedia.org/wiki/Modelo_lineal_generalizado#Componentes_del_modelo
2 votos
Creo que esta respuesta corta: stats.stackexchange.com/a/18812/28666 es relevante y se suma a las respuestas aquí (insinuando a por qué Los GLM se definieron originalmente con la familia de dispersión exponencial).
0 votos
@amoeba interesante información (de vuelta de 2011, ¡qué hallazgo! jaja). Así que, si lo entendí bien, el nombre GLM se extendió a todo modelo de expectativas condicionales exponenciales resoluble por IRLS, lo cual es mucho menos pragmático de lo que esperaba.