37 votos

Más eficiente de la parcela funciones en R cuando millones de puntos?

Me parece de R puede tomar un largo tiempo para generar parcelas cuando millones de puntos - de extrañar, dado que los puntos se trazan de forma individual.

Muchos de los puntos que se superponen y forman una masa negra y una gran cantidad de tiempo se dedica a conspirar puntos más en esa misa.

¿Hay alguna representación de funciones que el comercio fuera de tiempo de procesamiento para el trabajo con anticipación qué trazado es redundante?

Yo no estoy en busca de una densidad de trama (aunque esos son a menudo útiles), me gustaría que el mismo resultado que una simple parcela de llamar, pero mucho más rápido que millones de overplots si es posible.

46voto

Jay Puntos 395

Mira la hexbin paquete que implementa el papel/el método por Dan Carr. El pdf de la viñeta tiene más detalles que cito a continuación:

1 Visión general

Hexágono binning es una forma de bivariante histograma útil para la visualización de la struc - tura en conjuntos de datos con gran n. El concepto subyacente de la hexagonal el agrupamiento es extremadamente simple;

  1. el plano xy sobre el conjunto (rango(x), rango(y)) es de triangulación por una cuadrícula regular de hexágonos.
  2. el número de puntos que caen en cada hexágono se cuentan y se almacena en una estructura de datos
  3. los hexágonos con count > 0 se representa con una rampa de color o de diferentes el radio del hexágono en proporción a la cuenta. El algoritmo subyacente es extremadamente rápido y ecaz para la visualización de la la estructura de los conjuntos de datos con $n \ge 10^6$

Si el tamaño de la cuadrícula y de los recortes en la rampa de color son elegidos en una inteligente de la moda de la estructura inherente en los datos debe surgir en el binned parcelas. Los mismos advertencias aplicar a hexagon binning como se aplican a histogramas y el cuidado debe ser ejercido en la elección de la binning parámetros

17voto

Brett Veenstra Puntos 10238

Debo admitir que no entiende su último párrafo:

"Yo no estoy en busca de un diagrama de densidad (aunque esos son a menudo útiles), me quiere el mismo resultado como un simple parcela de llamar, pero mucho más rápido que millones de overplots si es posible."

Tampoco está claro qué tipo de trama (función) que está buscando.

Dado que usted tiene métrica de las variables, puede encontrar que el hexágono binned parcelas o sunnflower parcelas útil. Para más referencias, véase

14voto

ESRogs Puntos 1381

Esta es una tarea difícil, sin soluciones listas (esto es, por supuesto, porque la densidad de la trama es tan tentador de reserva que a nadie le importa). Así que, ¿qué puedes hacer?

Si realmente se superponen (es decir, tienen exactamente el mismo de X e Y las coordenadas) y usted no está utilizando el alfa, la mejor idea sería sólo para reducir la superposición usando unique (con alfa, que pueden ser resumidos sobre dichos grupos).

Si no, usted puede manualmente la ronda de las coordenadas de los pixeles más cercanos y utilizar el método anterior (sin embargo, esta es una solución sucia).

Finalmente, usted puede hacer un diagrama de densidad sólo a utilizar para la submuestra de los puntos en la mayoría de las áreas densas. Esto por otra parte no va a hacer exactamente el mismo de la trama y puede introducir artefactos si no se ajusta con precisión.

7voto

Phoenix Puntos 501

Otra respuesta directa a la pregunta es la rgl paquete, que puede parcela millones de puntos utilizando OpenGL. Además, especifique un tamaño de punto (por ejemplo, 3) y alejar el zoom para ver estos centros de masas como bloques monolíticos, o ampliar la imagen y ver la estructura de lo que solía ser monolítico de los tamaños de punto son constantes, pero las distancias entre ellos en la pantalla dependen del zoom. Los niveles de alfa también puede ser utilizado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X