7 votos

¿Por qué el gráfico de Tableau's Box / Whisker muestra valores atípicos automáticamente y cómo puedo deshacerme de él?

Tengo un conjunto de datos se muestra como una caja-bigotes de gráficos después de la desagregación. Ver a continuación.

enter image description here

Me pregunto por qué Tableau (el producto que estoy utilizando) automáticamente parcelas de un montón de valores fuera de la caja-bigotes. Yo pensaba que los bigotes de la caja son los valores mínimos y máximos. Se dice que los valores por encima del máximo de la barba de casos atípicos, pero no veo la necesidad de mostrar y segundo no está seguro de qué lógica se utiliza para calcular. Así que sólo me preguntaba si alguien sabe por qué alguien quiere mirar un cuadro-bigote gráfico que tiene valores atípicos se muestra así en lugar de ellos se encuentra dentro de la caja-bigotes? (I. e. es común práctica de la estadística?)

8voto

AdamSane Puntos 1825

La costumbre (y original) de la definición de un cuadro y diagrama incluye los valores atípicos (de hecho, de Tukey había dos tipos de puntos de la periferia, que en estos días están a menudo no se distingue).

Específicamente, los extremos de los bigotes en la Tukey boxplot ir a la más cercana de las observaciones dentro del interior de las cercas, que están generalmente en la parte superior de la bisagra + 1.5 H-se extiende y de la bisagra inferior - 1.5 H-diferenciales (básicamente, UQ + 1.5 IQR y LQ - 1.5 IQR). Lo que está fuera de esas es marcado como valores atípicos.

Eso es lo que la R, por ejemplo:

boxplot of stopping distances

Hay muchas variaciones en el diagrama de caja, y algunos paquetes de implementar otras cosas que el Tukey boxplot, pero es la más común. De hecho, Wickham Y Stryjewski "40 años de boxplots", menciona numerosas variaciones (y eso es sólo una fracción de lo que se puede encontrar por ahí).

Véase el artículo de Wikipedia sobre el diagrama de caja para algunos detalles básicos.

Por cierto, Tableau no sólo muestra los valores atípicos - mostrando todos los datos. Se puede ver que el marcado de puntos entre los extremos de los bigotes, e incluso los puntos dentro de las cajas, no sólo las que están fuera del centro de las cercas.

Tableau describe su boxplots aquí; como se puede ver la descripción en términos generales coincide con lo que yo describo para Tukey boxplots de arriba.


Edit: Esto es sólo para agregar un dibujo de lo que el boxplot de los elementos de la Schmid y Crowe referencias mencionadas en los comentarios para que la gente no tenga que buscarlos para ver lo que se está debatiendo:

enter image description here

(la Crowe versión es ligeramente ajustado aquí en un par de maneras, uno de los cuales hace parecer un poco más boxplot; que yo pueda hacer más fieles versión posterior)

4voto

TableauUser Puntos 31

Tableau ofrece dos opciones: diagrama de caja esquemática, que a menudo se denomina diagrama de caja de Tukey y diagrama de caja esquelética. Este último tiene bigotes que se extienden de mínimo a máximo. Los bigotes anteriores se extendían a los puntos de datos más cercanos dentro de 1.5 IQR desde las bisagras. Hay una opción para cambiar si se muestran todos los puntos en la visualización o solo los valores atípicos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X