Si recuerdas, OLS minimiza la suma de los residuos al cuadrado ∑iu2i mientras que la regresión mediana minimiza la suma de los residuos absolutos ∑i∣ui∣ . El estimador de la mediana o de las desviaciones mínimas absolutas (LAD) es un caso especial de regresión cuantílica en el que se tiene q=.5 . En la regresión cuantílica minimizamos una suma de errores absolutos que recibe ponderaciones asimétricas por sobrepredicción (1−q) y q por falta de predicción. Se puede partir de la representación LAD y ampliarla como la suma de la fracción de los datos que están ponderados por q y (1−q) dado su valor de ui y trabajar en él de la siguiente manera:
ρq(u)=1(ui>0)q∣ui∣+1(ui≤0)(1−q)∣ui∣=1(yi−x′iβq>0)q∣yi−x′iβq∣+1(yi−x′iβq≤0)(1−q)∣yi−x′iβq∣ Esto sólo utiliza el hecho de que ui=yi−x′iβq y entonces se puede reescribir la función indicadora como sumas de las observaciones que satisfacen las condiciones de los indicadores. Esto dará la primera expresión que escribiste para el estimador de regresión cuantil.
=n∑i:yi>x′iβqq∣yi−x′iβq∣+n∑i:yi≤x′iβq(1−q)∣yi−x′iβq∣=qn∑i:yi>x′iβq∣yi−x′iβq∣+(1−q)n∑i:yi≤x′iβq∣yi−x′iβq∣=qn∑i:yi>x′iβq(yi−x′iβq)−(1−q)n∑i:yi≤x′iβq(yi−x′iβq)=qn∑i:yi>x′iβq(yi−x′iβq)−n∑i:yi≤x′iβq(yi−x′iβq)+qn∑i:yi≤x′iβq(yi−x′iβq)=qn∑i=1(yi−x′iβq)−n∑i=11(yi−x′iβq≤0)(yi−x′iβq)=n∑i=1(q−1(ui≤0))ui
La segunda línea elimina los pesos de las sumas. La tercera línea elimina los valores absolutos y los sustituye por los valores reales. Por definición yi−x′iβq es negativo siempre que yi<x′iβq de ahí el cambio de signo en esta línea. La cuarta línea multiplica (1−q) . Entonces te das cuenta de que qn∑i:yi>x′iβq(yi−x′iβq)+qn∑i:yi≤x′iβq(yi−x′iβq)=n∑i=1(yi−x′iβq) y sustituyendo la suma del término medio en la cuarta línea por el indicador correspondiente se llega a la quinta línea. Factorizando y luego sustituyendo yi−x′iβq avec ui produce la segunda expresión de su estimador.
Esto demuestra que las dos expresiones son equivalentes.