32 votos

¿Regresión del quantile "trabaja"?

Estoy con la esperanza de obtener una interfaz intuitiva, accesible explicación de regresión cuantil.

Digamos que tengo un simple conjunto de datos de resultado $Y$, y los predictores $X_1, X_2$.

Si, por ejemplo, tengo un cuantil de regresión en .25,.5,.75, y se vuelven a $\beta_{0,.25},\beta_{1,.25}...\beta_{2,.75}$.

Son las $\beta$ los valores encontrados por el simple pedido de la $y$ de los valores, y la realización de una regresión lineal con base en los ejemplos que están en o cerca de el dado cuantil?

O hacer todas las muestras de contribuir a la $\beta$ estimaciones, con descendente pesos como la distancia desde el cuantil aumenta?

O es algo totalmente diferente? Aún tengo que encontrar un lugar accesible explicación.

33voto

icelava Puntos 548

Recomiendo Koenker Y Hallock (2001, Journal of Economic Perspectives) y Koenker del homónimo libro de texto.

  1. El punto de partida es la observación de que la mediana de un conjunto de datos minimiza la suma de errores absolutos. Es decir, el 50% de los cuantiles es una solución a un determinado problema de optimización (para encontrar el valor que minimiza la suma de errores absolutos).
  2. A partir de esto, es fácil encontrar que cualquier $\tau$-cuantil es la solución a un determinado problema de minimización, es decir, para minimizar una suma de forma asimétrica ponderada de los errores absolutos, con pesos que dependen de $\tau$.
  3. Por último, para hacer el paso a la regresión, el modelo de la solución a este problema de minimización, como una combinación lineal de las variables predictoras, por lo que ahora el problema es el de no encontrar un valor único, sino un conjunto de parámetros de regresión.

Por lo que su intuición es muy correcto: todas las muestras de contribuir a la $\beta$ estimaciones, con asimétricas pesos dependiendo del cuantil $\tau$ nuestro objetivo.

28voto

Bolo Puntos 181

La idea básica de regresión cuantil proviene del hecho de la que el analista está interesado en la distribución de los datos, en lugar de que sólo la media de los datos. Vamos a empezar con el medio.

La media de regresión se ajusta a una línea de la forma de $y=X\beta$ a la media de los datos. En otras palabras, $E(Y|X=x)=x\beta$. Un enfoque general para la estimación de esta línea es el uso de método de cuadrados mínimos, $\arg\min_\beta (y-x\beta)'(y-X\beta)$.

En el otro lado de la mediana de regresión busca una línea que esperar que la mitad de los datos que están en los lados. En este caso el objetivo de la función es $\arg\min_\beta |y-X\beta|$ donde $|.|$ es la primera norma.

Se extiende la idea de la mediana para los cuantiles resultados de regresión Cuantil. La idea detrás de esto es encontrar una línea que $\alpha$- % de los datos están más allá de eso.

Aquí se hizo un pequeño error, Q-regresión no es como encontrar un cuantil de datos, a continuación, ajuste una línea a un subconjunto (o incluso de las fronteras que es más difícil).

Q-regresión busca una línea que divide los datos en una qroup un $\alpha$ cuantil y los restos. Función de destino, diciendo que la función de la comprobación de Q-regresión es $$ \hat\beta_\alpha=\arg\min_\beta \bigg\{\alpha |y-X\beta| I(y>X\beta) + (1-\alpha) |y-X\beta|I(y<X\beta)\bigg\}. $$

Como se puede ver esta ingeniosa función de destino no es más que la traducción de los cuantiles a un problema de optimización.

Por otra parte, como se puede ver, Q-regresión se define por un cierto quantie ($\beta_\alpha$) y, a continuación, puede ser extendido para encontrar todos los cuantiles. En otras palabras, P-regresión puede reproducir (condicional) distribución de respuesta.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X