Estoy leyendo este post que habla sobre Robustos de regresión Lineal en un Bayesiano de configuración. La entrada del blog en particular se puede encontrar aquí:
http://twiecki.github.io/blog/2013/08/27/bayesian-glms-2/
Hubo un bit en particular que yo no podía manejar. El autor habla de regresión robusta y dice que en la presencia de valores atípicos un frecuentista sería utilizar una distancia cuadrática medida para evaluar el ajuste. A continuación, él o ella habla sobre suponiendo que los datos se distribuyen de acuerdo a la t de student distribución con colas más pesadas.
El poco que me tiene confundido es (hablando de tener un normal antes):
Como se puede ver, el ajuste es bastante sesgada y tenemos una buena cantidad de incertidumbre en la estimación, como se indica por la amplia gama de diferentes posterior predictivo de las líneas de regresión. ¿Por qué es esto? La razón es que la distribución normal no tiene una gran cantidad de masa en las colas y, en consecuencia, un valor atípico afectará el ajuste firmemente.
Yo no siga de por qué tener más ligero de peso en los valores de lejos es lo que es peor. Cualquier indicio de por qué esto es así, sería muy apreciado.