¿Qué tan malo puede ser heterocedasticidad antes de causar problemas?

Question

¿Qué tan malo puede ser heterocedasticidad antes de causar problemas?

Preguntado el 13 de Enero, 2015: Cuando se hizo la pregunta
372 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Abierta: Estado actual de la pregunta

Tengo dos preguntas acerca de heterocedasticidad en regresiones múltiples.

De acuerdo a mi fiel del libro de texto (Utilizando el análisis Multivariante de 2007, pág.127), se dice que las desviaciones de heterocedasticidad sólo reducir la potencia estadística de la prueba, en lugar de inflar el tipo de la tasa de error (¿es esto cierto?)
Quería saber si hay alguna guía sobre cómo juzgar los tamaños del efecto para heteroscadisticity y cuánto es un mal tamaño del efecto para la materia (con N=187). Porque yo uso dos variables categóricas, por suerte mi residual/predijo la parcela está en dos grupos diferenciados que puedo analizar (ver más abajo):

Multiple regression, three predictosrs, two categorical predictors. N=187

Preguntado el 13 de Enero, 2015 por Stu Andrews

Answer 1

1 Respuestas

Answer 2

5voto

Sean Hanley Puntos 2428

Es cierto que heterocedasticidad reducir su poder (ver: la Eficiencia de la beta estimaciones con heterocedasticidad), pero también puede inflar los errores de tipo I. Considere la siguiente simulación (codificado en R):

set.seed(1044)                          # this makes the example exactly reproducible
b0 = 10                                 # these are the true values of the intercept
b1 = 0                                  #  & the slope
x  = rep(c(0, 2, 4), each=10)           # these are the X values
hetero.p.vector = vector(length=10000)  # these vectors are to store the results
homo.p.vector   = vector(length=10000)  #  of the simulation

for(i in 1:10000){                      # I simulate this 10k times
  y.homo   = b0 + b1*x + rnorm(30, mean=0, sd=1)  # these are the homoscedastic y's

  y.x0     = b0 + b1*0 + rnorm(10, mean=0, sd=1)  # these are the heteroscedastic y's
  y.x2     = b0 + b1*2 + rnorm(10, mean=0, sd=2)  #  (notice the SDs of the error
  y.x4     = b0 + b1*4 + rnorm(10, mean=0, sd=4)  #   term goes from 1 to 4)
  y.hetero = c(y.x0, y.x2, y.x4)

  homo.model         = lm(y.homo~x)               # here I fit 2 models & get the
  hetero.model       = lm(y.hetero~x)             #  p-values
  homo.p.vector[i]   = summary(homo.model)$coefficients[2,4]
      hetero.p.vector[i] = summary(hetero.model)$coefficients[2,4]
}
mean(homo.p.vector<.05)    # there are ~5% type I errors in the homoscedastic case
# 0.049                    #  (as there should be)
mean(hetero.p.vector<.05)  # but there are ~8% type I errors w/ heteroscedasticity
# 0.0804

Modelos lineales (tales como la regresión múltiple), tienden a ser bastante robusto, aunque. En general, una regla de oro es que está bien, siempre y cuando la mayor varianza no es más de cuatro veces el de menor varianza. Esta es una regla de oro, por lo que debe ser tomado por lo que vale. Sin embargo, observe que en la simulación anterior, en el heteroscedastic modelo, el más alto de la varianza se $16\times$ la más pequeña de la varianza ($4^2=16$, vs $1^2 = 1$) y el tipo resultante de la tasa de error es: $8\%$ en lugar de $5\%$.

Respondido el 13 de Enero, 2015 por Sean Hanley (2428 Puntos )

¿Qué tan malo puede ser heterocedasticidad antes de causar problemas?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Qué tan malo puede ser heterocedasticidad antes de causar problemas?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: