7 votos

Visualización de la frecuencia de las actividades

Hola comunidad de analistas de datos. Tengo el siguiente problema:

Dado un conjunto de n unidades y un plazo en días. Una unidad puede estar activa en un día determinado en un grado determinado (en el rango de 0,0 a 1,0). Un resultado deseable es que si una unidad está activa, lo esté durante una serie de días consecutivos (o como máximo con un día de interrupción).

Lo que tengo, por supuesto es lo contrario :). Ahora quiero medir o incluso mejor visualizar las frecuencias de actividad para "probar" a una persona afín a la imagen que no todas las unidades se comportan como se desea. El enfoque de fuerza bruta es dibujar una línea para cada unidad (a lo largo de la línea de tiempo), coloreada según el grado de actividad, pero como n > 30, el gráfico es grande, colorido y no se ve nada en absoluto.

Me temo que estoy buscando en la dirección equivocada. ¿Alguna idea o sugerencia?

EDITAR: Creo que no he sabido explicar bien mi objetivo: no quiero visualizar la actividad de una unidad singular, sino hacerme una idea de la frecuencia de actividad de todas las unidades implicadas. Al final, tendré dos grupos de unidades y quiero ver gráficamente si un grupo rindió mejor que el otro (mejor según la propiedad descrita anteriormente). Mis disculpas por no haber expuesto esto antes (gracias a las contribuciones hasta este punto, he podido ver lo que realmente quiero saber).

5voto

jldugger Puntos 7490

Usted podría estar tratando de incorporar demasiada información en el gráfico. La esencia de la visualización de la que parece ser la frecuencia con la que las unidades se activa más de un día y, posiblemente, los tiempos en que esas unidades están activas.

Sólo para generar ideas, porque hay muchas posibles soluciones, considere la posibilidad de una pantalla que proporciona una gráfica clara distinción entre el largo plazo y el corto plazo y permite que las evaluaciones de las frecuencias con que éstos se producen. Una solución simple es un diagrama de dispersión donde contiguos de la actividad de una unidad entre los tiempos de $x$ $x + y$ está indicado por un punto en $(x,y)$. Modificar una característica saliente de la punta, tales como su color, para hacer hincapié en la distinción entre el$y \ge 1$$y \lt 1$.

Aquí es un crudo ejemplo: la primera parcelas de unidades en el eje vertical (de 200), tiempo en el horizontal (75 días; se necesita una cuadrícula para mostrar las unidades de tiempo), y las actividades de la unidad en una escala de grises donde más oscuro corresponde a más de continua actividad. La segunda muestra datos similares como un diagrama de dispersión. El último podría ser acompañado por un histograma de frecuencias. El ex debe tener las unidades ordenadas verticalmente por su longitud media en servicio.

alt text

alt text

1voto

Riri Puntos 4000

¿Qué te parece crear pequeñas líneas de tiempo para cada unidad, una encima de otra, ordenadas de mayor a menor actividad? Piensa en Destellos

Probablemente podría hacer algo como resaltar el tiempo inactivo como una parte sombreada del gráfico o una parte coloreada de la línea de tiempo de la unidad.

Como cada unidad tendría una pequeña parcela, se podría ver la actividad de un individuo en un momento dado. Y la clasificación por actividad mostraría el bajo rendimiento de algunas unidades, ya que los gráficos son más planos (y/o están más llenos del indicador de inactividad) a medida que se desciende en el gráfico.

No tengo grandes ideas sobre con qué software crear esto. Usted podría ser capaz de hacerlo con Lattice en R.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X