4 votos

Los valores atípicos cambian el signo de la relación lineal

Tengo un gráfico de dispersión con la Hgb A1C como variable explicativa (eje "x") y la FPG (eje "y") como variable de resultado. Existe una relación lineal positiva pero débil. Hay un valor atípico en la dirección "y". Hay 1 valor atípico en la dirección x. Cuando se elimina cada uno de estos puntos, r cambia en direcciones opuestas. Intento explicar por qué ocurre esto, en un lenguaje sencillo.

¿Tendría sentido decir: Cuando se elimina el valor atípico en la dirección y, r aumenta porque un valor atípico que normalmente cae a una distancia de la línea de regresión disminuiría el tamaño del coeficiente de correlación.

Cuando se elimina el valor atípico en la dirección x, r disminuye porque un valor atípico que normalmente cae cerca de la línea de regresión aumentaría el tamaño del coeficiente de correlación.

¿Tiene esto sentido?

5voto

ESRogs Puntos 1381

Esto se suele llamar el problema de apalancamiento; es más fácil de entender en el lenguaje de la optimización en el que se hace la regresión.

Básicamente, queremos tener una línea tal que la suma de los residuos al cuadrado (distancias en y entre los puntos y la línea de regresión) sea mínima; por ello, un solo punto con coordenadas extremas puede tener una contribución dominante a esta suma.
He aquí un ejemplo de esta situación. La línea verde parece más correcta, pero su coste es enorme debido al residuo del valor atípico (negro) -- por eso se genera la línea roja.

enter image description here

En su caso, la línea se hace simplemente entre esos dos valores atípicos, ignorando o tratando el resto de puntos como uno solo.

1voto

Zizzencs Puntos 1358

Lo que la eliminación de los valores atípicos hará a una línea de regresión depende, por supuesto, de dónde estén los valores atípicos. Así que, en lugar de utilizar "normalmente cae", yo sería más específico. Y podría ser más claro si se habla de adición de valores atípicos que de eliminación de los mismos. Pero creo que básicamente tienes razón.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X