Estoy usando el quantreg paquete para hacer un modelo de regresión utilizando el percentil 99 de mis valores en un conjunto de datos. Con base en las recomendaciones del anterior stackoverflow pregunta me preguntó, he utilizado el siguiente código de la estructura.
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
que me muestran graficados en la parte superior de mis datos. He representado este uso de ggplot2, con un valor de alfa para los puntos. Creo que la cola de mi distribución no está siendo considerado suficientemente en mi análisis. Tal vez esto es debido al hecho de que hay puntos individuales, que están siendo ignorados por el percentil tipo de medición.
Uno de los comentarios sugirieron que
El paquete viñeta incluye secciones lineales de regresión cuantil y también modelos con splines de suavizado, etc.
Basado en mi pregunta anterior me supone un logarítmica de la relación, pero no estoy seguro de si eso es correcto. Pensé que podía extraer todos los puntos en el percentil 99 de intervalo y, a continuación, examine por separado, pero no estoy seguro de cómo hacerlo, o si que es un buen enfoque. Agradecería cualquier consejo sobre cómo mejorar la identificación de esta relación.