8 votos

¿Cuáles son las buenas formas de representación de las distribuciones a lo largo del tiempo mediante R?

He ~400 personas y >10k cada uno de los puntos de tiempo (los resultados de la simulación) me gustaría ser capaz de supervisar a medida que cambian con el transcurso del tiempo. Punteo de todos los individuos es demasiado complicado, el trazado de la media +sd, min/max, o cuantiles es muy poca información para mi gusto. Me pregunto qué otras personas han llegado a visualizar este tipo de datos. Si había un menor número de puntos de datos que me gustaría utilizar beanplots para cada punto temporal, pero que no iba a funcionar para muchos de los puntos de tiempo.

1voto

Me gustaría utilizar un pulidor, tales como:

geom_smooth(method='loess')

o se me submuestra de sus datos y de la trama solo una de cada 5 personas, y cada una de las 10 pasos de tiempo (por ejemplo).

library(ggplot2)    
# Data looks like:
#   Subject   Timestep  Y
#   1         1         0.5
#   1         2         0.6    
#   1         3         0.6
#   1         4         0.7
temp=subset(data, ((as.numeric(subject)%%5)==0) & ((as.numeric(Timestep)%%10)==0))
qplot(Timestep,Y,data=temp)

o ambos.

1voto

dan90266 Puntos 609

Estas son algunas sugerencias. Mi sugerencia es usar la mitad-violín parcelas como se muestra en la http://biostat.mc.vanderbilt.edu/HmiscNew el uso de la R Hmisc paquete summaryS función y lattice gráficos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X