No sé si hay una respuesta general que se aplique en todos los casos, pero creo que un factor importante es que las desviaciones son más notables en las colas.
Suponga que sospecha que la variable en cuestión debería tener una distribución normal. Para concretar, digamos que es la altura de los hombres adultos. Ahora bien, en una muestra de tamaño razonable (digamos N = 100) la Normal podría predecir una sola persona que mide más de 1,90 metros. Pero si no hay ninguna, o dos, eso será muy evidente. Por otro lado, podría predecir 10 personas entre 1,5 y 1,5 metros. Si hay 9, u 11, eso no será tan evidente.
También puede ser que el actual la distribución no es exactamente normal. Pero, de nuevo, las desviaciones serán más evidentes en las colas.
set.seed(1234) #Sets a random number seed
dist1 <- rnorm(100,0, 1) #Random normal with N = 100, mean 0, sd 1
dist2 <- c(dist1, 4) #Add a single extreme point
dist3 <- c(dist1, 0) #Add a point at the mean
qqplot(dist1,dist2)
qqplot(dist1, dist3)