7 votos

Manejo de valores atípicos en regresión lineal bayesiana.

Estoy leyendo este post que habla sobre Robustos de regresión Lineal en un Bayesiano de configuración. La entrada del blog en particular se puede encontrar aquí:

http://twiecki.github.io/blog/2013/08/27/bayesian-glms-2/

Hubo un bit en particular que yo no podía manejar. El autor habla de regresión robusta y dice que en la presencia de valores atípicos un frecuentista sería utilizar una distancia cuadrática medida para evaluar el ajuste. A continuación, él o ella habla sobre suponiendo que los datos se distribuyen de acuerdo a la t de student distribución con colas más pesadas.

El poco que me tiene confundido es (hablando de tener un normal antes):

Como se puede ver, el ajuste es bastante sesgada y tenemos una buena cantidad de incertidumbre en la estimación, como se indica por la amplia gama de diferentes posterior predictivo de las líneas de regresión. ¿Por qué es esto? La razón es que la distribución normal no tiene una gran cantidad de masa en las colas y, en consecuencia, un valor atípico afectará el ajuste firmemente.

Yo no siga de por qué tener más ligero de peso en los valores de lejos es lo que es peor. Cualquier indicio de por qué esto es así, sería muy apreciado.

7voto

AdamSane Puntos 1825

Considerar un conjunto de datos sin periféricas observaciones, en un adecuado valor de los parámetros. Ahora considere la posibilidad de mover una observación muy lejos en la cola (manteniendo los valores de los parámetros y los datos restantes constante)

Si la densidad ha delgada colas, una observación muy lejos es muy poco probable (tiene una baja probabilidad relativa dado los parámetros), por lo que la oportunidad de verla ... y por lo tanto, la probabilidad sería mayor si los parámetros se han movido sustancialmente para adaptarse a ellas (hay un límite a lo lejos, por supuesto, como el más que pasar los parámetros, menos probables en el resto de los datos.

Por el contrario, una distribución con colas de grasa no ver que la observación inusual, y no necesita cambiar en respuesta a ella.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X