R -- al igual que muchos, pero no todos los programas -- la mayoría de los usos de Tukey definición* de cómo dibujar un boxplot.
La totalidad de la muestra original se utiliza para calcular las bisagras (donde la caja de los extremos están dibujados).
Las bisagras son muy similares a los cuartiles (se podría decir que son una particular forma de calcular los cuartiles superior e inferior que difiere ligeramente de la más habitual de las definiciones de los cuartiles, aunque hay un número de diferentes definiciones de la muestra en cuartiles así; de hecho R ofrece nueve distintos cuartil cálculos, sin contar las bisagras de sí mismos).
La parte superior de la bisagra es la mediana de la mitad superior de los datos (la mitad superior incluye la mediana de la muestra original si fue un punto de datos) y la parte inferior de la bisagra es la mediana de la mitad inferior (que también incluye la mediana de la muestra original si fue en un punto de datos):
$\qquad$
Así, por ejemplo, con 6 observaciones las bisagras son el segundo más grande y el 5º más grande de la observación (3 puntos en cada mitad). Con 9 observaciones las bisagras son la 3ª y la 8ª mayor (5 puntos en cada uno de los media, la mediana viene en dos mitades). Con 11 observaciones de la bisagra inferior está a medio camino entre la 3ª y la 4ª de observación más grande y la parte superior de la bisagra está a medio camino entre el 8 y 9 de observación más grande (6 puntos en cada mitad). La ilustración muestra el caso con 13 de las observaciones.
Tenga en cuenta que los cuartiles (/bisagras) no son sensibles a los valores de los valores atípicos, sólo el hecho de que están fuera de los cuartiles. Puede mover todos ellos cerca de los extremos del cuadro (por lo que no hay valores atípicos) sin cambiar los cuartiles/bisagras, o tan lejos como usted desee (así que todos están lejos), de nuevo sin cambiar los valores de los cuartiles. Así no tendría que estar realmente no necesita hacer nada cuando hay un "outlier".
* O bien, de uno de ellos; de Tukey dio varias definiciones, aunque para los propósitos actuales, sólo necesitamos que preocuparse acerca de cómo el cálculo de las bisagras de las obras; lo digo sobre todo porque la versión con "valores atípicos" sería lo de Tukey se llama un esquema de la trama, pero ellos no hacen el uno con dos tipos distintos de "atípico" las marcas.