¿Cómo determinar el número de inicializaciones aleatorias a utilizar en el escalado multidimensional no métrico?

Question

¿Cómo determinar el número de inicializaciones aleatorias a utilizar en el escalado multidimensional no métrico?

Preguntado el 11 de Enero, 2016: Cuando se hizo la pregunta
419 visitas: Cuantas visitas ha tenido la pregunta
1 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Estoy intentando determinar cuántas inicializaciones aleatorias (reinicios) debo utilizar al realizar una ordenación nMDS. Entiendo que quiero elegir la solución que minimice la tensión, pero cuántos reinicios aleatorios son necesarios para asegurarme de que he encontrado la configuración de menor tensión para la ordenación ? ¿Cuántos reinicios aleatorios ofrecerá un número adecuado de configuraciones entre las que elegir la de menor tensión?

(Nota: había una confusión en mi formulación original de esta pregunta. El número de iteraciones (vs. arranques aleatorios ) para cada inicialización no puede determinarse realmente sin realizar realmente las iteraciones y examinar cuándo se produce realmente la convergencia en la minimización de tensiones).

Me gustaría asegurarme de que no estoy encontrando simplemente una "solución local", y supondría que el mayor número de reinicios aumentaría a menudo (aunque no siempre) mis posibilidades de evitar ese problema (aunque se trata de una cuestión casi totalmente distinta que probablemente se haya tratado en otro lugar).

¿Debería influir en el número de reinicios el número de muestras, el número de variables por muestra, el número de dimensiones, etc.? ¿O debería simplemente elegir un gran número de reinicios y seguir con ello? ¿Hay alguna norma?

Supongamos que dispongo de un ordenador lo suficientemente potente (por ejemplo, un PC potente pero no un clúster de supercomputación) como para que el tiempo de procesamiento y la potencia no sean los factores limitantes.

Mis datos (si está interesado):

Una matriz de distancias Bray-Curtis con 130816 valores que se calculó a partir de datos con 512 filas diferentes (muestras) y 49 columnas diferentes (variables).
Quiero una ordenación 2D.
Estoy utilizando el nmds en la función ecodist en R.

Preguntado el 11 de Enero, 2016 por gatnowurry

Answer 1

1 Respuestas

Answer 2

1voto

gatnowurry Puntos 41

No es realmente una respuesta a la pregunta, pero quizá sea la mejor respuesta posible:

Según esta página No importa cuántos arranques aleatorios utilices, puede que no encuentres el mínimo global:

El NMDS es algo sensible a las posiciones iniciales y, de hecho, a veces se asienta en un óptimo local que no es la mejor solución... Hay varios enfoques para minimizar el problema. Uno de ellos consiste en probar varios arranques aleatorios y quedarse con el mejor resultado (menor tensión). Se nunca se garantiza haber encontrado la mejor solución pero si la mayoría de sus resultados alcanzan niveles bajos de estrés similares, entonces puede estar razonablemente seguro de que al menos ha encontrado una BUENA solución, si no la mejor en teoría .

Respondido el 23 de Agosto, 2017 por gatnowurry (41 Puntos )

¿Cómo determinar el número de inicializaciones aleatorias a utilizar en el escalado multidimensional no métrico?

Respuesta

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Cómo determinar el número de inicializaciones aleatorias a utilizar en el escalado multidimensional no métrico?

Respuesta

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: