5 votos

Nonparameteric aproximación de densidad multivariante--¿por dónde comienzo?

Actualmente estoy trabajando en un proyecto de investigación que requiere de un método fiable para no paramétrico de estimación de densidad de kernel. Algunos detalles acerca de mi problema:

  • He a $N$ puntos de muestreo $X_1,X_2...X_N$, cada uno de los cuales corresponde a un resultado de una $M$ dimensiones variable aleatoria $W = (w_1..w_M)$. Me gustaría asignar una densidad de cada uno de estos puntos de una manera precisa y consistente.

  • Estoy buscando un método que no se asume que las variables aleatorias independientes. Como en mi situación, yo sé que $f(W) \neq \prod_{i=1}^M {f_m(w_i)}$.

  • En mi caso, $N \leq 25000$ $M \leq 5$ pero puedo generar los datos tanto como sea necesario.

Abierto a cualquier y todas las sugerencias!

3voto

T.J. Crowder Puntos 613

Para aquellos que están buscando un lote método para la estimación del ancho de banda, yo sugeriría que el multivariante ancho de banda estimador de [1] -- el cálculo aproximado en C que la interfaz de Matlab se puede obtener desde el siguiente enlace: http://www.vicos.si/images/2/2e/KDE_bw_Matlab.zip

Si usted tiene grandes cantidades de datos (por ejemplo, el orden de los 1000), es posible que no tiene sentido aplicar el estándar de batch. En su lugar se puede utilizar la línea de Densidad de Kernel Estimador de [1], de los cuales implementación en Matlab se puede obtener de este sitio: http://www.vicos.si/Research/Multivariate_Online_Kernel_Density_Estimation (También algunos ejemplos en video del proceso de estimación se incluyen)

[1] Multivariante en Línea Estimación de Densidad de Kernel con Granos de Gauss Matej Kristan, Aleš Leonardis, y Danijel Skočaj, Reconocimiento de patrones, 2011

1voto

MattSayar Puntos 723

Cómo poner los puntos en un Kd árbol? Esto es rápido y fácil en la 5d (de hecho hasta 20d, incluso 128d). Entonces usted puede encontrar la más cercana a los vecinos de la sola consulta de puntos de una cuadrícula; o hacer la reducción de datos, manteniendo los promedios de las hojas, de 10 o de 100 puntos. (Que de estos qué quieres hacer ?)

Si estás usando scipy.espacial.cKDTree, véase también el fragmento de código forleaves() en un árbol Kd.

1voto

highBandWidth Puntos 977

El paquete de ks en R puede hacer estimación de densidad de kernel multivariante. Supongo que depende de cuántas dimensiones tiene y si desea visualizar el pdf multivariante o calcular ciertas expectativas. KS pueden manejar hasta 6 datos dimensionales.

1voto

Jeff Yates Puntos 162

Estoy buscando a un problema similar, y aunque no puedo señalar a implementaciones concretas, he encontrado un par de artículos que dan multivariante estimaciones de densidad que no se supone que para ser independiente a priori, y que también evitar la "maldición de la dimensionalidad", al menos en cierta medida. Estos son:

  1. Bosque de Estimación de Densidad por Liu Han, Min Xu, Haijie Gu, Anupam Gupta, Juan Lafferty, Larry Wasserman (CMU)

  2. Estimación de densidad de Árboles por Parikshit Ram, Alexander G. Gris (Georgia Tech)

Si se ejecutan en una aplicación general, por favor enviar una actualización!

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X