5 votos

Analizar y generar "grumoso" de las distribuciones?

Hay maneras estándar de análisis y la generación de "grumoso" de las distribuciones?

  • analizar: ¿cómo grumoso es un punto dado en la nube (en 1d, 2d, nd), ¿cuáles son sus grumoso coeficientes?

  • generar o sintetizar un pseudo-aleatorio en la nube con los coeficientes de C

(Estos son los elementos básicos para cualquier familia de distribuciones, por ejemplo, normal.)

Hay muchos tipos de clumpiness en la naturaleza (los atascos de tráfico, clumpiness de los cambios climáticos), así que es un amplio término con el que me imagino que varios intentos de descripción y varios enlaces a la "clásica" de las estadísticas.
Estoy buscando una visión general; fotos estaría bien.

Añadido el viernes 22 de Oct: yo tenía la esperanza de encontrar métodos para ambos análisis y síntesis,
abstract <-> real de ambas maneras; sin duda, una amplia gama de abstracción debe hacer ambas cosas. Sigo buscando ...

(Los expertos por favor agregar etiquetas).

4voto

Berek Bryan Puntos 349

Creo conveniente 'grumoso coeficientes' son medidas de autocorrelación espacial, tales como Moran I y C de Geary. Estadística espacial no es mi área y no sé acerca de la simulación, aunque.

4voto

Judioo Puntos 625

Si la evaluación espacial de auto-correlación, es lo que usted está interesado, aquí es un papel que simula datos y evalúa los diferentes auto-regresivo de los modelos en R.

La autocorrelación espacial y la selección simultánea de modelos autorregresivos por: W. D. Kissling, Carl G. Mundial de la Ecología y la Biogeografía, Vol. 17, Nº 1. (Enero 2008), pp 59-71. PDF (disponible aquí)

Por desgracia no tienen el código en R se utiliza para generar los datos simulados, pero que sí tienen el código de cómo encajan cada uno de los modelos en el material complementario.

Sería sin duda ayuda, aunque si podría ser un poco más claro acerca de la naturaleza de los datos. Muchas de las técnicas para el análisis espacial probablemente no será implementado en los datos de mayor dimensión, y estoy seguro de que hay otras técnicas que son más adecuados. Algún tipo de K-vecinos más cercanos técnica podría ser útil, y asegúrese de cambiar su término de búsqueda de grumoso del clúster.

Algunas otras referencias que pueden ser útiles. Me imagino que el mejor de los recursos para la simulación de datos, de tal manera sería con paquetes en el programa R.

Sitios web le sugiero que visite el Spatstat paquete de R página, y la R Cran Vista de Tareas para datos espaciales. También me gustaría sugerir que usted echa un vistazo a la GeoDa centro de la página, y nunca se sabe el OpenSpace grupo de Google puede tener alguna información útil. También me he topado con este R lista de correo sobre datos de geo, pero no me he peinado el archivo mucho en este punto (pero estoy seguro que no hay datos útiles en allí).


Edit: Para aquellos interesados en la simulación de una pre-especifica la cantidad de espacio de auto-correlación en una distribución, recientemente me encontré con un papel que le da una bastante simple procedimiento recomendado (Dray, 2011, página 136);

He utilizado los siguientes pasos para obtener una muestra con un determinado autocorrelación nivel de $\rho$: (1) generar un vector $y$ contiene 100 iid aleatorias distribuidas normalmente valores, (2) calcular la inversa de la matriz de $(I - \rho{W})^{-1}$ y (3) premultiply el vector $y$ por la matriz obtenida en (2) para obtener autocorrelated de datos en el vector $x$ (es decir, $x = (I - \rho{W})^{-1}y$ ).

La única cosa que no se definen aquí es que $W$ es un a priori, se define la matriz de ponderación espacial. No estoy seguro de cómo esto podría traducirse en multivariante caso, pero espero que sea útil a alguien!

Cita:

Dray, Stephane. 2011. Una nueva perspectiva acerca de Moran coeficiente de autocorrelación Espacial como una regresión lineal problema. Análisis Geográfico 43(2):127-141. (por desgracia no he venido a través de un público pdf del documento)

2voto

Omar Kooheji Puntos 384

Puede calcular un índice de dispersión, medida a lo largo de su espacio para medir clumpiness. Un punto de partida para obtener más información sería la ecología de los paquetes y la literatura para ver cómo simular este tipo de cosas.

2voto

nerdmonkey Puntos 191

Típico de las medidas de autocorrelación, tales como Moran I, son las estimaciones mundiales de clumpiness y podría ser enmascarada por una tendencia o por el "promedio" de clumpiness. Hay dos maneras que usted podría manejar esto: 1) Utilizar una medida local de la autocorrelación - pero la desventaja es que usted no recibe un número único de clumpiness. Un ejemplo de esto sería Local de Moran I* Aquí es un documento (a partir de una búsqueda en google) que, al menos, introduce los términos y da algunas derivaciones http://onlinelibrary.wiley.com/doi/10.1111/0022-4146.00224/abstract

2) el Uso de una estadística orientada específicamente hacia el punto de distribuciones y sus clumpieness en distintas escalas espaciales, tales como Ripley K http://scholar.google.com/scholar?q=Ripley%27s+K&hl=es&as_sdt=0&as_vis=1&oi=scholart

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X