4 votos

¿Cómo determinar el número de inicializaciones aleatorias a utilizar en el escalado multidimensional no métrico?

Estoy intentando determinar cuántas inicializaciones aleatorias (reinicios) debo utilizar al realizar una ordenación nMDS. Entiendo que quiero elegir la solución que minimice la tensión, pero cuántos reinicios aleatorios son necesarios para asegurarme de que he encontrado la configuración de menor tensión para la ordenación ? ¿Cuántos reinicios aleatorios ofrecerá un número adecuado de configuraciones entre las que elegir la de menor tensión?

(Nota: había una confusión en mi formulación original de esta pregunta. El número de iteraciones (vs. arranques aleatorios ) para cada inicialización no puede determinarse realmente sin realizar realmente las iteraciones y examinar cuándo se produce realmente la convergencia en la minimización de tensiones).

Me gustaría asegurarme de que no estoy encontrando simplemente una "solución local", y supondría que el mayor número de reinicios aumentaría a menudo (aunque no siempre) mis posibilidades de evitar ese problema (aunque se trata de una cuestión casi totalmente distinta que probablemente se haya tratado en otro lugar).

¿Debería influir en el número de reinicios el número de muestras, el número de variables por muestra, el número de dimensiones, etc.? ¿O debería simplemente elegir un gran número de reinicios y seguir con ello? ¿Hay alguna norma?

Supongamos que dispongo de un ordenador lo suficientemente potente (por ejemplo, un PC potente pero no un clúster de supercomputación) como para que el tiempo de procesamiento y la potencia no sean los factores limitantes.


Mis datos (si está interesado):

  • Una matriz de distancias Bray-Curtis con 130816 valores que se calculó a partir de datos con 512 filas diferentes (muestras) y 49 columnas diferentes (variables).
  • Quiero una ordenación 2D.
  • Estoy utilizando el nmds en la función ecodist en R.

1voto

gatnowurry Puntos 41

No es realmente una respuesta a la pregunta, pero quizá sea la mejor respuesta posible:

Según esta página No importa cuántos arranques aleatorios utilices, puede que no encuentres el mínimo global:

El NMDS es algo sensible a las posiciones iniciales y, de hecho, a veces se asienta en un óptimo local que no es la mejor solución... Hay varios enfoques para minimizar el problema. Uno de ellos consiste en probar varios arranques aleatorios y quedarse con el mejor resultado (menor tensión). Se nunca se garantiza haber encontrado la mejor solución pero si la mayoría de sus resultados alcanzan niveles bajos de estrés similares, entonces puede estar razonablemente seguro de que al menos ha encontrado una BUENA solución, si no la mejor en teoría .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X