Es casi siempre una trampa para eliminar las observaciones para mejorar un modelo de regresión. Usted debe dejar de observaciones sólo cuando usted realmente piensa que estas son en realidad los valores atípicos.
Por ejemplo, usted tiene la serie de tiempo de la frecuencia cardiaca el monitor conectado a su reloj inteligente. Si usted echa un vistazo a la serie, es fácil ver que no sería erróneo observaciones con lecturas como 300bps. Estos deben ser removidos, pero no porque quieres mejorar el modelo (lo que significa). Son errores en la lectura que no tienen nada que ver con el ritmo de su corazón.
Una cosa a tener cuidado es la correlación de los errores en los datos. En mi ejemplo, se podría argumentar que tiene errores cuando el monitor de ritmo cardíaco es desplazadas durante los ejercicios como correr o saltar. Que hará que estos errores correlacionados con el corazón de la tasa. En este caso, se debe tener cuidado en la eliminación de estos valores atípicos y los errores, porque no son al azar
Te voy a dar un ejemplo de cuando no eliminar los valores atípicos. Digamos que usted está midiendo el movimiento de un peso en una primavera. Si el peso es pequeño en relación a la fuerza del peso, entonces te darás cuenta de que Hooke la ley funciona muy bien: $$F=-k\Delta x,$$ where $F$ is force, $k$ - tension coefficient and $\Delta x$ es la posición del peso.
Ahora bien, si se ponen muy pesados o desplazar el peso demasiado, vamos a empezar a ver las desviaciones: en lo suficientemente grandes desplazamientos de la $\Delta x$ el movimiento se parecen desviarse del modelo lineal. Así, usted puede ser tentado para eliminar los valores atípicos para mejorar el modelo lineal. Esta no sería una buena idea, debido a que el modelo no está funcionando muy bien ya que la ley de Hooke es sólo aproximadamente el derecho.
ACTUALIZACIÓN
En tu caso yo sugeriría tirando de los puntos de datos y mirarlos más de cerca. Podría ser el instrumento del laboratorio fracaso? La interferencia externa? Ejemplo de defecto? etc.
El siguiente tratar de identificar si la presnece de estos valores atípicos puede ser correlacionada con lo que se mide, como en el ejemplo que me dio. Si no hay correlación no hay ninguna manera sencilla de hacerlo. Si no hay correlación, a continuación, puede eliminar los valores atípicos