27 votos

Modelización de la regresión con varianza desigual

Me gustaría ajustar un modelo lineal (lm) donde la varianza de los residuos depende claramente de la variable explicativa.

La forma que conozco de hacerlo es usando glm con la familia Gamma para modelar la varianza, y luego poner su inversa en los pesos en la función lm (ejemplo: http://nitro.biosci.arizona.edu/r/chapter31.pdf )

Me preguntaba:

  • ¿Es ésta la única técnica?
  • ¿Qué otros enfoques son pertinentes?
  • ¿Qué paquetes/funciones de R son relevantes para este tipo de modelización? (aparte de glm, lm)

5 votos

¿Dónde utilizan glm() entonces lm() en el capítulo que enlazas. Me parece que el glm() es todo lo que se requiere y se utiliza allí, pero puede que me haya perdido algo. Puedes probar con los mínimos cuadrados generalizados ( gls() en nlme ) que permite estimar ponderaciones para controlar el tipo de heteroscedasticidad que usted menciona; véase ?varFunc y seguir los enlaces desde allí. IIRC varFixed() hará lo que tú quieras.

0 votos

En 'proc mixed', 'subject=option' produce una estructura diagonal de bloques en la matriz de varianza-covarianza de los residuos. ¿Ha considerado entonces un modelo lineal mixto general para alterar la hipótesis de homocedasticidad?

0 votos

Gracias Gavin, he mirado un poco estas funciones. Dos preguntas: 1) ¿Recomiendas algún tutorial? (Sospecho que el libro del MASS puede ser un buen comienzo, pero me preguntaba si tenías alguna idea al respecto). 2) Dado que el modelo que estoy ajustando es un simple OLS, ¿cuál es la diferencia en la estimación cuando se utiliza la función gls? (Si no recuerdo mal, no mucho, ya que debería funcionar con alguna aproximación iterativa de primer grado, pero no estoy nada seguro de ello). Ocram - gracias, pero no uso SAS.

20voto

JMW.APRN Puntos 21

Las píldoras contra el "efecto megáfono" incluyen (entre otras):

  1. Utilizar la transformación logarítmica o de raíz cuadrada $Y$ . Esto no es exacto, pero a veces se controla el ensanchamiento.
  2. Utilice regresión de mínimos cuadrados ponderados . En este enfoque, cada observación recibe su propio factor de varianza. Esta respuesta muestra cómo utilizar WLSR en R (por ejemplo, si la varianza de los residuos es proporcional a las medias, puede proporcionar como pesos la inversa del valor ajustado en el modelo no ponderado).
  3. Utilice la regresión robusta. La función rlm() en el MASS de R hace una estimación M, que se supone que es robusta a la desigualdad de varianzas.

Edición de julio de 2017: Parece que los mínimos cuadrados generalizados, como se sugiere en la respuesta de Greg Snow, es una de las mejores opciones.

2 votos

Me basé en esta respuesta para un Pregunta de Stack Overflow .

1 votos

Podría valer la pena señalar también la opción de mínimos cuadrados generalizados, utilizando gls con la opción de pesos establecida en varFixed() - a mí me parecería una de las opciones más elegantes...

0 votos

@TomWenseleers Estoy de acuerdo. Fíjate que esta es la respuesta de Greg Snow.

14voto

Eero Puntos 1612

El gls en la función nlme para R puede estimar la regresión y la relación con la varianza al mismo tiempo. Véase el weights y el segundo ejemplo en la página de ayuda.

11voto

Misha M Puntos 1978

Con la gamlss se puede modelar la distribución del error de la respuesta como una función lineal, no lineal o suave de las variables explicativas. Esto parece ser una muy potente enfoque (aprendí un lote sobre todas las posibilidades que pueden surgir durante el proceso de selección del modelo) y todo está muy bien explicado en varias publicaciones (incluyendo libros) a las que se hace referencia en el enlace anterior.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X