2 votos

Un enfoque para visualizar/investigar datos multidimensionales

Estoy intentando analizar un gran conjunto de mediciones empíricas sujetas a dos transformaciones parametrizadas. En esencia, las funciones toman 3 parámetros de 'conteo' y devuelven una secuencia de floats en cada configuración. Espero ver algunos patrones interesantes surgir cuando se seleccionen los parámetros apropiados. Anticipo que los patrones podrían ser relativos entre las secuencias devueltas para cada función y/o relacionarse con patrones de algún tipo en los parámetros. En caso de que sea relevante, los 3 parámetros de 'conteo' corresponden aproximadamente a:

  • 'tamaño de ventana' en los datos subyacentes sobre los cuales se calculan las estadísticas resumidas
  • Una cantidad de ventanas consecutivas utilizadas para calcular una única estadística resumida (es decir, la compensación entre una mayor precisión espacial o temporal)
  • Una 'edad mínima' - un desplazamiento en la historia de los datos subyacentes.

Las estadísticas resumidas no son triviales pero son sensibles de manera independiente a los tres parámetros.

Estoy interesado en técnicas de visualización - adecuadas para la investigación ad-hoc - que me ayudarán a experimentar con estos datos multidimensionales.

EDICIÓN (En respuesta a Peter Ellis): Tu 'juego de palabras' es, básicamente, mi problema. No he almacenado los datos, en su lugar, puedo calcularlos 'sobre la marcha' a partir de datos empíricos en masa (de lo contrario opacos). Si almacenara los resultados de mi cálculo en forma de matriz, sería una matriz 4D... Las tres primeras dimensiones son todas temporales - como se identificó anteriormente - luego el índice de la secuencia resultante también es temporal - y los valores son una métrica escalar específica del problema sin dimensiones... representada utilizando un número de punto flotante. Uno podría imaginar los datos visualizándose asociando una distribución (función) con cada 'voxel' en un cuboide. Visualizo estas secuencias (que representan la distribución asociada con cada voxel) de forma aislada, como funciones continuas muestreadas regularmente. Una forma en la que he imaginado los datos es con las secuencias como gráficos de líneas, y tres 'perillas de ajuste' que puedo usar para 'sintonizar' un resultado... otra es como cualquiera de las tramas de superficie con dos 'perillas de ajuste'. Una visualización más elaborada anima un rango de valores para una de las 'perillas de ajuste' - dejándome un parámetro para ajustar manualmente. La estructura de los datos no sugiere qué parámetros son los mejores en qué contexto - y la respuesta a esto puede depender tanto de los datos empíricos (aún por recopilar por completo) como de la escala de los parámetros. Una complicación significativa es que no sé, hasta el momento, cuán sensibles serán los resultados de mis cálculos a los parámetros anteriores... Un objetivo es encontrar valores para los dos primeros parámetros para minimizar el impacto del tercero. Más allá de eso, y analogías entre mis parámetros y el tiempo, me temo que los datos son bastante abstractos... no hay un objeto del mundo real del cual inspirarse.

3voto

Vincent Zoonekynd Puntos 1028

Sus datos parecen ser de la forma $u=f(x,y,z,t)$, es decir, una serie de tiempo para cada punto en el espacio, donde las coordenadas espaciales son el tamaño de la ventana, el número de ventanas y el desplazamiento. Esto puede considerarse como un arreglo de 4 dimensiones (la función $f$) o un conjunto de puntos $(x,y,z,t,u)$ en un espacio de 5 dimensiones (el gráfico de $f$).

Aquí hay algunas ideas para visualizar conjuntos de datos de alta dimensionalidad.

El "gran recorrido" (disponible en aplicaciones como ggobi) es una animación que muestra la nube de puntos rotando en el espacio, es decir, varias proyecciones más o menos aleatorias del espacio de 5 dimensiones en el plano. Dado que, para este conjunto de datos, las primeras cuatro coordenadas $(x,y,z,t)$ están dispuestas en una cuadrícula, solo verías esa cuadrícula.

Las parcelas de coordenadas paralelas y los métodos generales de reducción de dimensiones (PCA, MDS) probablemente presenten los mismos problemas debido a la presencia de la cuadrícula: los datos realmente son de 4 dimensiones.

Puede adaptar algunos de los gráficos descritos en el libro de J. Klemela, Suavizado de datos multivariados (están diseñados para densidades, pero también deberían funcionar para funciones definidas en una cuadrícula, como aquí), pero no son muy estándar y entender lo que realmente significan lleva mucho tiempo.

Puede dividir los datos: tomar puntos $(x,y,z)$ al azar y graficar la serie de tiempo correspondiente: puede agruparlos en diferentes patrones (algunos podrían estar aumentando, otros disminuyendo, otros pueden presentar un bulto, algunos podrían ser ruidosos, otros suaves, etc.), ya sea manualmente o utilizando algún algoritmo de agrupamiento.

Puede agrupar los datos en la dimensión temporal: para cada punto $(x,y,z)$, podría calcular algunas "métricas" de la serie temporal correspondiente, como máximo, mínimo, promedio, rango, variación absoluta, etc. Cada una de esas métricas podría visualizarse como un gráfico de contorno tridimensional.

Puede agrupar los datos en las dimensiones espaciales: graficar $\sum_{x,y,z} f(x,y,z,t)$ versus $t$ (una sola curva) o $\sum_{x,y} f(x,y,z,t)$ versus $t$ para todos los valores de $z$ (muchas curvas, ya sea en el mismo gráfico o en gráficos diferentes). Puede reemplazar la suma con el promedio, la mediana, la desviación estándar, etc.

0voto

Boris Tsirelson Puntos 191

Podrías usar una superficie 3D, utilizando la cuarta dimensión para colorear la trama y la quinta dimensión para animarla.

0voto

Lars Kotthoff Puntos 253

Podrías intentar un gráfico de radar. Una de las dimensiones podría usarse para animarlo, o podrías tener todas las dimensiones temporales como líneas en el gráfico. A medida que los valores temporales se mueven hacia afuera, es posible que puedas ver un patrón en el movimiento de las otras dimensiones. De manera similar, podrías probar con coordenadas paralelas.

0voto

ebryn Puntos 4037

Asegúrate de ojear este libro para ver si alguna de las técnicas descritas aquí funcionará para ti.

http://www.amazon.com/Parallel-Coordinates-Multidimensional-Geometry-Applications/dp/0387215077/ref=lh_ni_t

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X