6 votos

Ayudar a comprender la virtud de los modelos lineales generalizados

En la página 4 de https://www.sagepub.com/sites/default/files/upm-binaries/21121_Chapter_15.pdf Los autores afirman la siguiente fuerza de los modelos generalizados, que no acabo de entender.

De hecho, uno de los puntos fuertes del paradigma del MLG -en contraste con las transformaciones de la variable de respuesta en la regresión lineal- es que la elección de la transformación linealizadora está parcialmente separada de la distribución de la respuesta, y la misma transformación no tiene que normalizar a la vez la distribución de Y y hacer que su regresión sobre las X sea lineal. Los vínculos específicos que pueden utilizarse varían de una familia a otra y también, en cierta medida, de una implementación de software de los MLG a otra. Por ejemplo, no sería prometedor utilizar los enlaces de identidad, log, inverso, inverso-cuadrado o raíz cuadrada con datos binomiales, ni sería sensato utilizar el enlace logit, probit, log-log o log-log complementario con datos no binomiales.

  1. Entiendo que la transformación que hace que la regresión sea lineal es la función de enlace. Pero ¿a qué se refieren con la transformación que normaliza la distribución de Y?

  2. ¿Cómo serían las distribuciones si las transformaciones tuvieran que ser las mismas?

  3. ¿Cómo justifican los ejemplos la propiedad declarada? Parece que hablan de ejemplos en los que no es aconsejable utilizar funciones de enlace arbitrarias con una distribución determinada, pero la fuerza que afirman es que se pueden utilizar funciones arbitrarias.

6voto

Sean Hanley Puntos 2428
  1. El modelo de regresión por mínimos cuadrados ordinarios supone que los errores se distribuyen normalmente (y con varianza constante). De forma equivalente, se podría decir que las distribuciones condicionales de $Y$ son normales. Sin embargo, a menudo no lo son; por ejemplo, pueden estar muy sesgados, con varianzas residuales diferentes, la aparición de probables "valores atípicos", etc. Una forma de resolver estos problemas algo comunes es transformar $Y$ . Por ejemplo, a menudo resulta útil tomar el logaritmo de $Y$ y todos esos problemas desaparecen. En tal caso, las distribuciones condicionales de $Y$ se convierten en normales. A eso se refieren. Sin embargo, con los datos de Bernoulli ( $Y \in \{0, 1\}$ ), ninguna transformación hará que la distribución condicional sea normal -siempre será Bernoulli. El objetivo de la función de enlace no es hacer $Y$ normal. (De hecho, la función de enlace ni siquiera se aplica a $Y$ se aplica al parámetro que gobierna el comportamiento de la distribución condicional. En el caso de la Bernoulli, es la probabilidad condicional, $p$ .) En cambio, la razón de la función de enlace es hacer posible que la parte derecha modele el parámetro necesario.

    Puede ser útil leer algunas de mis respuestas existentes que están relacionadas con esto:

  2. No estoy seguro de cómo responder a esto. Parece que se basa en una premisa errónea.

  3. El primer conjunto de transformaciones son miembros del conjunto de transformaciones de energía . Son (algunas de las) formas de transformar $Y$ para la regresión OLS. El segundo conjunto son posibles funciones de enlace para datos Bernoulli. No veo "arbitrario" en la cita del libro. Es cierto que existen infinitas transformaciones para normalizar la distribución condicional de $Y$ y hay esencialmente infinitas transformaciones que pueden usarse como funciones de enlace en un modelo de regresión binomial, pero en general son conjuntos infinitos diferentes y también hay conjuntos infinitos que no pueden usarse para cada uno. Para que una transformación de potencia corrija el sesgo, se desea una transformación monótona que reduzca progresivamente los valores más bajos (por ejemplo $\sqrt{Y}$ ) o ampliarlos progresivamente hacia arriba (por ejemplo $Y^2$ ); para una función de enlace para una respuesta binaria, se desea una función que transforme $(0, 1) \rightarrow (-\infty, \infty)$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X