Parece que estás usando R
. Si es así, tenga en cuenta que usted puede identificar los puntos en un diagrama de dispersión utilizando ?identificar. Creo que hay varias cosas que están pasando aquí. En primer lugar, usted tiene una muy influyente punto en la gráfica de LN_RT_vol_in ~ LN_AT_vol_in
(el resaltado) (.2, 1.5). Esto es muy probable que sea el residual estandarizado que se trata de -3.7. El efecto de ese punto será para aplanar la línea de regresión, se inclina más horizontales que las bruscamente hacia arriba de la línea, de lo contrario, habría conseguido. Un efecto de esto es que todos los residuos serán giradas hacia la izquierda respecto a donde habrían sido localizados dentro de la residual ~ predicted
parcela (al menos cuando se piensa en términos de que la covariable y haciendo caso omiso de la otra).
Sin embargo, la aparente línea recta de los residuos que se vea todavía estaría allí, tal como existen en algún lugar en las 3 dimensiones de la nube de los datos originales. Que puede ser difícil de encontrar en cualquiera de los bordes de las parcelas. Usted puede utilizar el identificar() la función de ayudar, y usted puede también utilizar la rgl paquete para crear una dinámica en 3D diagrama de dispersión que puede girar libremente con el ratón. Sin embargo, tenga en cuenta que la línea recta residuos se encuentran todos por debajo de los 0 en su valor de predicción, y por debajo de 0 residuos (es decir, están por debajo de la regresión ajustada de la línea); que le da una gran pista de donde buscar. Mirando de nuevo a su parcela de LN_RT_vol_in ~ LN_AT_vol_in
, creo que puede ver. Hay una bastante recta conjunto de puntos corriendo en diagonal hacia abajo y a la izquierda de sobre (-.01, -1.00) en el borde inferior de la nube de puntos en esa región. Sospecho que esos son los puntos en cuestión.
En otras palabras, los residuos de ver de esa manera porque son de esa manera en algún lugar dentro del espacio de datos. En esencia, esto es lo que @ttnphns es lo que sugiere, pero no creo que es una constante en cualquiera de las dimensiones originales, es una constante en una dimensión en un ángulo a su original ejes. Además, estoy de acuerdo con @MichaelChernick que esta aparente rectitud en el residual de la parcela probablemente es inofensivo, pero que sus datos no son realmente muy normal. Son algo normal-ish, sin embargo, y parece que tienes un buen número de datos, por lo que la CLT puede cubrirlo, pero puede que desee bootstrap en caso de. Por último, me preocuparía que 'outlier' es la conducción de sus resultados; un sólido enfoque es probablemente lo merece.