13 votos

Fórmula del estimador de regresión cuantil

He visto dos representaciones diferentes del estimador de regresión cuantil que son

$$Q(\beta_{q}) = \sum^{n}_{i:y_{i}\geq x'_{i}\beta} q\mid y_i - x'_i \beta_q \mid + \sum^{n}_{i:y_{i}< x'_{i}\beta} (1-q)\mid y_i - x'_i \beta_q \mid$$

y $$Q(\beta_q) = \sum^{n}_{i=1} \rho_q (y_i - x'_i \beta_q), \hspace{1cm} \rho_q(u) = u_i(q - 1(u_i < 0 ))$$

donde $u_i = y_i - x'_i \beta_q$ . ¿Puede alguien decirme cómo demostrar la equivalencia de estas dos expresiones? Esto es lo que he intentado hasta ahora, a partir de la segunda expresión.

$$ \begin{align} Q(\beta_q) &= \sum^{n}_{i=1} u_i(q - 1(u_i < 0 )) (y_i - x'_i \beta_q) \newline &= \sum^{n}_{i=1}(y_i - x'_i \beta_q)(q - 1(y_i - x'_i \beta_q < 0 )) (y_i - x'_i \beta_q) \newline &=\left[ \sum^{n}_{i:y_{i}\geq x'_{i}\beta}(q(y_i - x'_i\beta_q)) + \sum^{n}_{i:y_{i}< x'_{i}\beta}(q(y_i - x'_i\beta_q)-(y_i - x'_i\beta_q)) \right](y_i - x'_i\beta_q) \end{align} $$ Pero a partir de este punto me quedé atascado sobre cómo proceder. Por favor, tenga en cuenta que esto no es una pregunta de tarea o asignación. Muchas gracias.

14voto

Andy Puntos 10250

Si recuerdas, OLS minimiza la suma de los residuos al cuadrado $\sum_i u_{i}^{2}$ mientras que la regresión mediana minimiza la suma de los residuos absolutos $\sum_i \mid u_i \mid$ . El estimador de la mediana o de las desviaciones mínimas absolutas (LAD) es un caso especial de regresión cuantílica en el que se tiene $q = .5$ . En la regresión cuantílica minimizamos una suma de errores absolutos que recibe ponderaciones asimétricas por sobrepredicción $(1-q)$ y $q$ por falta de predicción. Se puede partir de la representación LAD y ampliarla como la suma de la fracción de los datos que están ponderados por $q$ y $(1-q)$ dado su valor de $u_i$ y trabajar en él de la siguiente manera:

$$ \begin{align} \rho_q(u) &= 1(u_i>0) \, q\mid u_i\mid + 1(u_i\leq 0) \, (1-q)\mid u_i \mid \newline &= 1(y_i - x'_i \beta_q > 0) \, q\mid y_i - x'_i \beta_q \mid + 1(y_i - x'_i\beta_q \leq 0) \, (1-q)\mid y_i - x'_i \beta_q \mid \end{align} $$ Esto sólo utiliza el hecho de que $u_i = y_i - x'_i \beta_q$ y entonces se puede reescribir la función indicadora como sumas de las observaciones que satisfacen las condiciones de los indicadores. Esto dará la primera expresión que escribiste para el estimador de regresión cuantil.

$$ \begin{align} &= \sum^{n}_{i:y_i>x'_i\beta_q}q\mid y_i - x'_i\beta_q \mid + \sum^{n}_{i:y_i\leq x'_i\beta_q} (1-q) \mid y_i - x'_i\beta_q \mid \newline &= q \sum^{n}_{i:y_i>x'_i\beta_q} \mid y_i - x'_i\beta_q \mid + (1-q)\sum^{n}_{i:y_i\leq x'_i\beta_q} \mid y_i - x'_i\beta_q \mid \newline &= q \sum^{n}_{i:y_i>x'_i\beta_q} (y_i - x'_i\beta_q) - (1-q)\sum^{n}_{i:y_i\leq x'_i\beta_q} ( y_i - x'_i\beta_q ) \newline &= q \sum^{n}_{i:y_i>x'_i\beta_q} (y_i - x'_i\beta_q) - \sum^{n}_{i:y_i\leq x'_i\beta_q} (y_i - x'_i\beta_q) + q \sum^{n}_{i:y_i\leq x'_i\beta_q} (y_i - x'_i\beta_q) \newline &= q \sum^{n}_{i=1} (y_i - x'_i \beta_q) - \sum^{n}_{i=1}1(y_i - x'_i\beta_q\leq 0)(y_i - x'_i\beta_q) \newline &= \sum^{n}_{i=1}(q - 1(u_i \leq 0))u_i \end{align} $$

La segunda línea elimina los pesos de las sumas. La tercera línea elimina los valores absolutos y los sustituye por los valores reales. Por definición $y_i - x'_i\beta_q$ es negativo siempre que $y_i < x'_i\beta_q$ de ahí el cambio de signo en esta línea. La cuarta línea multiplica $(1-q)$ . Entonces te das cuenta de que $$q\sum^{n}_{i:y_i>x'_i\beta_q}(y_i - x'_i\beta_q) + q\sum^{n}_{i:y_i \leq x'_i\beta_q}(y_i - x'_i\beta_q) = \sum^{n}_{i=1}(y_i - x'_i\beta_q)$$ y sustituyendo la suma del término medio en la cuarta línea por el indicador correspondiente se llega a la quinta línea. Factorizando y luego sustituyendo $y_i - x'_i\beta_q$ avec $u_i$ produce la segunda expresión de su estimador.
Esto demuestra que las dos expresiones son equivalentes.

0 votos

Para un enfoque computacional, véase stats.stackexchange.com/questions/384909/

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X