9 votos

Asesoramiento en la explicación de la heterogeneidad / heteroscedasticty

Estoy buscando alguna ayuda, consejo o consejos en cómo explicar la heterogeneidad / heterocedasticidad para los biólogos en mi departamento. En particular, quiero explicar por qué es importante detectar y tratar con él, si es que existe, yo estaba buscando opiniones sobre las siguientes preguntas.

  1. ¿Heterogeneidad influir en la fiabilidad de las estimaciones de efectos aleatorios? Estoy bastante seguro de que lo hace, pero yo no podía encontrar un papel.
  2. El grave problema es la heterogeneidad? He encontrado opiniones encontradas sobre este, aunque algunos afirman que el modelo estándar de errores, etc. no será fiable, también he leído que es un problema sólo si la heterogeneidad es grave. ¿Qué tan grave es grave?
  3. Asesoramiento sobre modelado de la heterogeneidad. En la actualidad, que se centran en gran medida en el paquete nlme en R y el uso de la varianza de las covariables, esto es bastante simple, y la mayoría de la gente aquí el uso de R, para proporcionar secuencias de comandos es útil. También estoy usando el MCMCglmm paquete, pero otras sugerencias son bienvenidos, sobre todo para los no-normalidad de los datos.
  4. Otras sugerencias son bienvenidos.

6voto

patfla Puntos 1

Una opción es utilizar una simulación. Para configurar un modelo donde específicamente especificar la heterogeneidad supongamos como $var(\alpha_i)=\overline{X}_i^2\sigma^2_u$. Luego de generar los datos de este modelo, tomando al azar intercepta como un simple ejemplo.

$$\alpha_i=\overline{X}_i u_i\;\;\;\;\;\; u_i\sim N(0,\sigma^2_u)$$

$$Y_ij=\alpha_{i}+\beta X_{ij} + e_{ij}\;\;\;\;\;\; e_{ij}\sim N(0,\sigma^2_e)$$

(espero que esta notación tiene sentido). Yo creo que jugando con un set-up como este le ayudará a responder la pregunta 2). De modo que este modelo de ajuste utilizando una muestra aleatoria de interceptar, cuando en realidad debería ser un azar de la pendiente (lo que le da una respuesta parcial a la pregunta 3 - aleatorio intercepta puede dar cuenta de "avivar" a un grado - este es el "nivel 2 fanning"). La idea de la anterior es la de intentar tan duro como usted puede romper su método de modelado - trate de condiciones extremas en consonancia con lo que usted sabe acerca de los datos, y ver qué pasa. Si usted está luchando para encontrar estas condiciones, entonces no te preocupes.

Hice una rápida revisión de heterocedasticidad por OLS, y no parece afectar a la estimación de las betas demasiado. A mí me parece que heterocedasticidad en algunos lugares, dando una sub-estimación de la probabilidad de error, y en otros lugares se le dará una sobre-estimación de la probabilidad de error (en términos predictivos). Ver a continuación:

a la espera de la trama de datos, el usuario actualmente frustrado con los equipos

Y una cosa que siempre me parece divertido es este "no-normalidad de los datos" que la gente se preocupa. Los datos no necesitan ser distribuidos normalmente, pero el término de error. Si esto no fuera cierto, entonces GLMs no iba a funcionar - GLMs el uso de una aproximación normal a la función de probabilidad para estimar los parámetros, como hacer GLMMs.

Así que yo diría que si la estimación de los parámetros de efecto fijo es el objetivo principal, entonces no hay mucho de qué preocuparse, pero se pueden conseguir mejores resultados para la predicción mediante la toma de heterocedasticidad en cuenta.

6voto

John Richardson Puntos 1197

Alometría sería un buen lugar para empezar que será familiar para los biólogos. Logaritmic transformaciones se utilizan a menudo en la alometría debido a que los datos tienen una ley de potencia de forma, pero también porque el ruido de proceso es heteroskedastic (como la variabilidad es proporcional al tamaño). Para un ejemplo donde esto ha causado un grave problema, consulte "ecuaciones Alométricas para la predicción de la masa corporal de los dinosaurios", donde la conclusión de que los dinosaurios eran sólo la mitad del tamaño previamente, aunque era incorrecta debido a un inválido assumtion de homocedasticidad (ver la correspondencia para más detalles).

0voto

Matchu Puntos 185

Los mejores recursos en línea GRATIS sé que para aprender acerca de heterocedasticidad es el Prof. Thoma del ECON 421 conferencias de 2011. Específicamente conferencias 1 - 7. Sus conferencias son muy organizados y fáciles de seguir, independientemente de su disciplina.

Aquí está la primera conferencia. Usted puede Encontrar el resto de las clases en el Invierno de 2011 semestre aquí. http://www.youtube.com/watch?v=WK03XgoVsPM

También, el sitio web correspondiente para el Prof. Thoma del Econ 421 curso tiene los Problemas de la Tarea y así como sus soluciones. Para las soluciones que requieren de software, la solución es el que se detalla paso a paso el uso de una combinación de texto, fórmulas, y las capturas de pantalla de Eviews.

A pesar de la los pasos utilizados para resolver los problemas de la tarea que se detallan mediante capturas de pantalla de E-views, las soluciones fácilmente se traducen bien en otros paquetes estadísticos tales como STATA o R estadísticas.

No hay Soluciones enumeradas para las Tareas del semestre de 2011, que es el Prof. Thoma del último video grabado semestre. Sin embargo, hay tareas disponibles para su Invierno 2012 semestre.

Aquí hay un enlace a la Tarea de la sección de soluciones de Prof. Thomas Invierno 2012 421 clase. Específicamente aquí está la Solución a la Tarea 3, en el que heterocedasticidad es introducido a la tarea de conjuntos. http://economistsview.typepad.com/economics421/2012/02/solution-to-homework-3.html

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X