6 votos

¿Por qué es importante la prueba Breusch-Pagan en los datos simulados diseñados para no ser heterocedásticos?

Yo estoy probando los residuos de una regresión lineal utilizando Breusch-Pagan Prueba para detectar Heterocedasticidad.

Este es el argumento de los residuos: Residuals

y este es el código R:

> library(lmtest)
> 
> mod <- lm(rnorm(1000)~1)
> 
> bptest(mod)

    studentized Breusch-Pagan test

data:  mod 
BP = 0, df = 0, p-value < 2.2e-16

Podría alguien decirme por qué se rechaza la hipótesis nula de homoscedástica errores?

La trama no se ve heteroscedastic.

EDITAR:

Sin embargo, la trama es un ejemplo, yo tengo dos de la lista de precios (priceA y priceB), necesito comprobar si los residuos generados por una regresión lineal de estas dos listas: lm(priceA ~ priceB + 0) necesito cero interceptar son homescedastic o no. Podría alguien darme un pequeño ejemplo? La longitud de cada precio de lista es de 750.

EDITAR:

También tengo:

BP = 67.4362, df = 1, valor-p < 2.2 e-16

con este gráfico new charts

No se homoscedástica? Me han conspirado para los residuos.

@Wolfgang, puedo obtener este resultado, siguiendo el ejemplo que has publicado.

> summary(mod)$r.squared * 750
[1] 681.0114

33voto

Bryan Rehbein Puntos 3947

Los resultados no son significativos, sin algún predictor (nota df=0). Heteroscedastic significa que la varianza no es constante, pero no es constante con respecto a qué? Tal vez usted tiene en mente el índice (orden de medición)? Entonces usted debe hacer

y <- rnorm(1000)
x <- 1:1000
mod <- lm(y~x)
bptest(mod) # I get p=0.59

Si usted acaba de tener un vector de números, no hay un montón de sentido a la pregunta "Es la varianza constante?" Por ejemplo, considere una mezcla de dos distribuciones normales con diferentes variaciones:

v <- sample(c(1,10), 100, repl=TRUE)
y <- rnorm(100, 0, v)

$\text{var}(y|v)$ no es constante, sino que depende de $v$. Pero incondicionalmente, $\text{var}(y)$ es sólo un número.

16voto

Derek Swingley Puntos 3851

No, los datos no son heteroscedastic (por la forma de cómo se simulado ellos). ¿Se nota el 0 grados de libertad de la prueba? Que es un indicio de que algo va mal aquí. El B-P de la prueba toma el cuadrado de los residuos del modelo y pruebas de si los predictores en el modelo (o cualquier otro predictores especifique) puede dar cuenta de la cantidad considerable de la variabilidad de estos valores. Dado que sólo el intercepto en el modelo, no toma en cuenta cualquier variabilidad por definición.

Echa un vistazo a: http://en.wikipedia.org/wiki/Breusch-Pagan_test

También, asegúrese de leer help(bptest). Que debe ayudar a clarificar las cosas.

Una cosa que va mal aquí es que el bptest() función aparentemente no probar este errante caso y pasa a tirar una pequeña p-valor. De hecho, si se mira con detenimiento el código subyacente de la bptest() función, fundamentalmente, de esto que está sucediendo:

format.pval(pchisq(0,0), digits=4)

que da "< 2.2e-16". Así, pchisq(0,0) devuelve 0 y que se convirtió en "< 2.2e-16" por format.pval(). En una manera, que es del todo correcta, pero probablemente ayudaría a prueba de cero dfs en bptest() para evitar este tipo de confusión.

EDITAR

Todavía hay mucha confusión sobre este asunto. Tal vez ayuda a mostrar realmente lo que el B-P de la prueba de realidad tiene. Aquí es un ejemplo. En primer lugar, vamos a simular algunos de los datos que se homoscedástica. A continuación, incluimos un modelo de regresión con dos variables dependientes. Y, a continuación, llevamos a cabo la B-P de la prueba con el bptest() función.

library(lmtest)
n <- 100    
x1i <- rnorm(n)
x2i <- rnorm(n)
yi  <- rnorm(n)
mod <- lm(yi ~ x1i + x2i)
bptest(mod)

Así que, ¿qué está ocurriendo realmente? En primer lugar, tomar el cuadrado de los residuos basado en el modelo de regresión. A continuación, tome $n \times R^2$ cuando la regresión de estos cuadrados de los residuos en los predictores incluidos en el modelo original (tenga en cuenta que el bptest() función utiliza la misma como predictores en el modelo original, pero también se pueden utilizar otros predictores aquí si uno sospecha que la heterocedasticidad es una función de otras variables). Que es el estadístico de prueba para el B-P de la prueba. Bajo la hipótesis nula de homoscedasticity, este estadístico de prueba sigue una distribución de la chi cuadrado con grados de libertad igual al número de predictores utilizados en la prueba (sin contar el intercepto). Por lo tanto, vamos a ver si podemos obtener el mismo resultado:

e2 <- resid(mod)^2
bp <- summary(lm(e2 ~ x1i + x2i))$r.squared * n
bp
pchisq(bp, df=2, lower.tail=FALSE)

Sí, eso funciona. Por casualidad, la prueba anterior puede llegar a ser importante (que es un error de Tipo I, ya que los datos simulados son homoscedástica), pero en la mayoría de los casos no es significativa.

2voto

Owen Fraser-Green Puntos 642

:Dail A la prueba de la no-varianza constante, uno debe entender las hipótesis detrás de la popular pruebas estadísticas. usted tiene que seguir la receta de la i,e, las pruebas que se describen en Cómo comprobar si la volatilidad es estacionaria? verificar plenamente que una serie no puede ser demostrado que no tienen varianza constante. Todas las seis de las pruebas que he esbozado debe ceder el paso a la aceptación de la hipótesis nula de no-varianza constante. Rechazo por parte de cualquiera de las 6 pruebas sugiere que la varianza de error es, de hecho, no constante.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X