10 votos

Asesoramiento en la identificación de forma de la curva usando quantreg

Estoy usando el quantreg paquete para hacer un modelo de regresión utilizando el percentil 99 de mis valores en un conjunto de datos. Con base en las recomendaciones del anterior stackoverflow pregunta me preguntó, he utilizado el siguiente código de la estructura.

mod <- rq(y ~ log(x), data=df, tau=.99)    
pDF <- data.frame(x = seq(1,10000, length=1000) ) 
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )

que me muestran graficados en la parte superior de mis datos. He representado este uso de ggplot2, con un valor de alfa para los puntos. Creo que la cola de mi distribución no está siendo considerado suficientemente en mi análisis. Tal vez esto es debido al hecho de que hay puntos individuales, que están siendo ignorados por el percentil tipo de medición.

Uno de los comentarios sugirieron que

El paquete viñeta incluye secciones lineales de regresión cuantil y también modelos con splines de suavizado, etc.

Basado en mi pregunta anterior me supone un logarítmica de la relación, pero no estoy seguro de si eso es correcto. Pensé que podía extraer todos los puntos en el percentil 99 de intervalo y, a continuación, examine por separado, pero no estoy seguro de cómo hacerlo, o si que es un buen enfoque. Agradecería cualquier consejo sobre cómo mejorar la identificación de esta relación.

enter image description here

1voto

Shea Parkes Puntos 2014

Todos los modelos están equivocados, pero algunos son útiles " (George Cuadro). Se está forzando una logrithmic forma a su equipados curva, y honestamente no se ve tan mal. El ajuste es pobre en la cola porque hay menos puntos, los dos parámetros que han permitido que se ajuste a la mayor parte de los datos. En otras palabras, en una escala logarítmica, que la cola no está lo suficientemente lejos de la mayor parte de sus datos a proporcionar apalancamiento. No tiene que ver con el cuantil de la naturaleza de la regresión; OLES también caso omiso de los puntos, en especial en la escala logarítmica).

Es bastante fácil para permitir algo más de la no-linealidad. Yo soy parcial a splines naturales, pero, de nuevo, todos los modelos están equivocados:

library(splines)
mod <- rq(y ~ ns(log(x), df=6), data=df, tau=.99)

El quantreg paquete tiene unos ganchos especiales para monótona splines si eso es motivo de preocupación para usted.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X