28 votos

¿Cuáles son las alternativas de rotura de ejes?

Los usuarios a menudo son tentados a romper los valores de los ejes para presentar los datos de los diferentes órdenes de magnitud en el mismo gráfico (ver aquí). Mientras que esto puede ser conveniente no siempre de la forma que prefiera para mostrar los datos (puede ser engañosa en el mejor de los casos). ¿Cuáles son las formas alternativas de visualización de datos que son diferentes en varios órdenes de magnitud?

Puedo pensar en dos formas, para iniciar la transformación de los datos o el uso de la celosía de las parcelas. ¿Cuáles son las otras opciones?

8voto

cbeleites Puntos 12461

Me gustaría separar el problema de registro de los ejes del problema de los gráficos de barras.

Ejes logarítmicas en mi humilde opinión son los más adecuados para las cosas que vienen o suceder en múltiplos (... aumenta por un factor de 20, cuando son tratados con ...).
En ese caso, 1 = 10⁰ es el origen natural. Hay toda una gama de física/química valores que son, de hecho, logarítmica, por ejemplo, el pH o la absorbancia $A = lg I_0 - lg I$, y que han "natural" de los orígenes. Para Una que podría ser $I_0$. Para el pH en aqeous soluciones, por ejemplo, 7.

Los gráficos de barras nunca puede ser sensible si no es sensato y fijos de origen, que toma el papel de un control (línea de base, en blanco). Pero esto no tiene nada que ver con el registro de los ejes.
El único uso que tiene para los gráficos de barras son los histogramas. Pero me imagino que lo hacen bien para mostrar la diferencia de este origen (también ver de inmediato si la diferencia es positiva o negativa). Debido a que las barras representan un área, tiendo a pensar que barcharts como una versión discretizada de área bajo una curva. Es decir, el eje x debe tener una métrica sentido (que puede ser el caso con el tiempo, pero no con las ciudades).

Si me iba a encontrar a mí mismo preguntándome qué origen a utilizar para el registro de algo que había una "natural" de origen en 0, me daría un paso atrás y reflexionar un poco sobre lo que está pasando. Muy a menudo, estos problemas son sólo un indicador de que el registro no es una sensible transformación de aquí.

Ahora un gráfico de barras con el registro de los ejes de relieve los aumentos o disminuciones que ocurren en los múltiplos. Sensata de los ejemplos que puedo pensar ahora todos tienen alguna relación lineal con un valor de interés. Pero tal vez alguien encuentra un buen ejemplo.

Así que creo que la transformación de datos debe ser sensible con respecto al significado de los datos en la mano. Este es el caso de la físico-química de las unidades que he mencionado anteriormente (a es proporcional a las concentraciones y pH, por ejemplo, una relación lineal para el voltaje en un pH-metro). De hecho, es tanto el caso, que el registro de la unidad recibe un nuevo nombre, y se utiliza en una forma lineal.

Por último, pero no menos importante, yo vengo de espectroscopía vibracional, donde rotos ejes son bastante habitual. Y yo considero que este utilice uno de los pocos ejemplos en los que la ruptura de los ejes no es engañar. Sin embargo, no tenemos cambios en el orden de magnitud. Simplemente tenemos un informativo de la región de 30 - 40 % de nuestra serie x: he Aquí un ejemplo: spectrum Para este ejemplo, la parte entre 1800 - 2800 /cm no puede contener ninguna información útil.
El informativo rango espectral es, por tanto, eliminado (que también se indican los rangos espectrales que en realidad el uso de quimiométricas de modelado): spectrum uninformative part removed

Pero para la interpretación de los datos, necesitamos lecturas precisas de la posición x. Pero en general no necesitamos múltiples que abarcan los diferentes rangos (es decir, la existencia de tales relaciones, pero la mayoría de las conexiones son más complicadas. E. g.: Señal en 3050/cm, por lo que hemos insaturados o sustancia aromática. Pero no hay señal fuerte a 1000/cm, por lo que no mono, meta, ni 1,3,5-sustituido anillo aromático ...)
Por lo que es mejor para representar x con una escala más grande (en realidad, a menudo utilizamos milímetro-hoja como guías o etiqueta la ubicación exacta). Así, se rompe el eje, y obtener una mayor x escala: spectrum - broken axis

En realidad, es muy parecida a la de facetting: facetted version
pero el eje roto en mi humilde opinión, hace hincapié en que la escala del eje x en dos partes es la misma. I. e. Intervalos dentro de los trazados de las regiones son los mismos.

A destacar pequeños intensidades (eje y), utilizamos magnifica márgenes:
enter image description here
[... Para más detalles, consulte el ampliada (x 20) vCH región en azul ....]

Y esto es ciertamente posible, con el ejemplo de los enlaces de las parcelas así.

4voto

CodingWithoutComments Puntos 9412

Soy muy cauteloso con el uso logarítmica de ejes en gráficos de barras. El problema es que usted tiene que elegir un punto de partida del eje, y esto es casi siempre arbitraria. Usted puede elegir para hacer dos barras tienen muy diferentes alturas, o casi de la misma altura, simplemente cambiando el valor mínimo en el eje. Estos tres gráficos de toda la trama de los mismos datos: alt text

Una alternativa a la discontinuo ejes, que nadie ha mencionado todavía,es simplemente para mostrar una tabla de valores. En muchos casos, las tablas son más fáciles de entender que los gráficos.

4voto

jldugger Puntos 7490

Algunas ideas adicionales:

(1) Que no tiene por qué limitarse a una transformación logarítmica. Buscar en este sitio para los "datos" transformación de la etiqueta, por ejemplo. Algunos datos se prestan muy bien a ciertas transformaciones, como una raíz o un logit. (Tales transformaciones, incluso los registros--suelen ser evitado cuando la publicación de gráficos para una audiencia no técnica. Por otro lado, pueden ser excelentes herramientas para ver patrones en los datos.)

(2) Usted puede pedir prestado una norma cartográfica de la técnica de establecer un detalle de un cuadro dentro de, o junto al gráfico. Específicamente, usted podría graficar los valores extremos por sí mismos en una carta y todos (o la) resto de los datos en otro más limitado del eje rango, a continuación, organizar gráficamente las dos, junto con indicaciones (visual y/o escrita) de la relación entre ellos. Pensar en un mapa de los estados unidos en la que Alaska y Hawaii que se insertan en diferentes escalas. (Esto no funciona con todos los tipos de gráficos, pero podría ser eficaz con los gráficos de barras en su ilustración.) [Veo que esto es similar a mbq la reciente respuesta.]

(3) Se puede mostrar el roto parcela de lado a lado con la misma trama continua de los ejes.

(4) En el caso de que el gráfico de barras ejemplo, elegir un adecuado (tal vez enormemente estiramiento) del eje vertical y proporcionar una panorámica de la utilidad. [Esto es más de un truco que genuinamente una técnica útil, en mi humilde opinión, pero podría ser útil en algunos casos especiales.]

(5) Seleccione un esquema diferente para mostrar los datos. En lugar de un gráfico de barras que utiliza longitud para representar los valores, seleccione una tabla en la que las áreas de símbolos que representan los valores, por ejemplo. [Obviamente, los trade-offs que participan aquí.]

Su elección de la técnica dependerá, probablemente, el propósito de la parcela: las parcelas creado para la exploración de datos a menudo difieren de las parcelas para el público en general, por ejemplo.

3voto

ESRogs Puntos 1381

Tal vez puede ser clasificada como celosía, pero voy a tratar; parcela de todas las barras de escala a lo más alto con un panel y poner otro panel con zoom en la parte inferior. He utilizado esta técnica una vez que en el caso de un diagrama de dispersión, y el resultado fue bastante agradable.

1voto

RB. Puntos 277

El roto-el eje de la solución funciona mejor cuando hay una ruptura clara a la derecha a través de la trama y de la ordenada etiquetados de modo que la diferencia es obvia. La ventaja de esta escala es que se conserva a través de los dos conjuntos de valores. Panel de parcelas con diferentes escalas de no transmitir la variación relativa dentro de las altas y bajas en los grupos. Me gusta la idea de que el zoom-en la parcela, que he programado para diagramas de dispersión, pero no había pensado en el uso de la barra de parcelas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X