Estoy intentando determinar cuántas inicializaciones aleatorias (reinicios) debo utilizar al realizar una ordenación nMDS. Entiendo que quiero elegir la solución que minimice la tensión, pero cuántos reinicios aleatorios son necesarios para asegurarme de que he encontrado la configuración de menor tensión para la ordenación ? ¿Cuántos reinicios aleatorios ofrecerá un número adecuado de configuraciones entre las que elegir la de menor tensión?
(Nota: había una confusión en mi formulación original de esta pregunta. El número de iteraciones (vs. arranques aleatorios ) para cada inicialización no puede determinarse realmente sin realizar realmente las iteraciones y examinar cuándo se produce realmente la convergencia en la minimización de tensiones).
Me gustaría asegurarme de que no estoy encontrando simplemente una "solución local", y supondría que el mayor número de reinicios aumentaría a menudo (aunque no siempre) mis posibilidades de evitar ese problema (aunque se trata de una cuestión casi totalmente distinta que probablemente se haya tratado en otro lugar).
¿Debería influir en el número de reinicios el número de muestras, el número de variables por muestra, el número de dimensiones, etc.? ¿O debería simplemente elegir un gran número de reinicios y seguir con ello? ¿Hay alguna norma?
Supongamos que dispongo de un ordenador lo suficientemente potente (por ejemplo, un PC potente pero no un clúster de supercomputación) como para que el tiempo de procesamiento y la potencia no sean los factores limitantes.
Mis datos (si está interesado):
- Una matriz de distancias Bray-Curtis con 130816 valores que se calculó a partir de datos con 512 filas diferentes (muestras) y 49 columnas diferentes (variables).
- Quiero una ordenación 2D.
- Estoy utilizando el
nmds
en la funciónecodist
en R.