¿Todas las optimizaciones no convexas son heurísticas?

Question

¿Todas las optimizaciones no convexas son heurísticas?

Preguntado el 19 de Julio, 2010: Cuando se hizo la pregunta
22351 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

La optimización convexa es un campo matemáticamente riguroso y bien estudiado. En la programación lineal, toda una serie de métodos manejables permiten obtener los óptimos globales en un tiempo récord. La programación cuadrática es casi igual de fácil, y hay una buena cantidad de métodos de programación semidefinida, cónica de segundo orden e incluso de programación entera que pueden funcionar bastante bien en muchos problemas.

Sin embargo, la optimización no convexa (y en particular las formulaciones extrañas de ciertos problemas de programación entera y optimización combinatoria) son generalmente heurísticas como la "optimización de colonias de hormigas". Básicamente, todos los algoritmos generalizables de optimización no convexa que he encontrado son una combinación (a menudo inteligente, pero aún así) de descenso de gradiente y algoritmos genéticos.

Puedo entender por qué es así -en superficies no convexas la información local es mucho menos útil- pero me imagino que al menos habría un algoritmo que aprendiera de forma demostrable para una amplia clase de funciones si las características locales indican un óptimo global cercano o no. También, tal vez, teorías generales sobre si se puede proyectar una superficie no convexa en dimensiones superiores para hacerla convexa o casi convexa, y cómo hacerlo.

Edición: Un ejemplo. Un polinomio de grado k conocido sólo necesita k + 1 muestras para ser reconstruido - ¿te da esto también el mínimo dentro de un rango dado de forma gratuita, o todavía tienes que buscarlo manualmente? Para cualquier clase más general de funciones, ¿la "capacidad de reconstruir" se traslada a la "capacidad de encontrar óptimos globales"?

Preguntado el 19 de Julio, 2010 por Campbell

0 votos

Aunque la cuestión Creo que La motivación que has escrito es muy polémica y probablemente podría ser un poco más neutra.

Comentado el 19 de Julio, 2010 por ashirley

0 votos

Muy bien, he cambiado un par de cosas - estos cambios en realidad hacen que la pregunta sea más clara, así que gracias por sugerirlo.

Comentado el 19 de Julio, 2010 por Campbell

0 votos

@DoubleJay: Buena reescritura. Así que, sólo para aclarar, su pregunta es algo así como "¿Existen algoritmos distintos de descenso gradiente + genética con propiedades demostrablemente agradable? ¿Podemos reducir la optimización no convexa a optimización convexa de forma sistemática?"

Comentado el 19 de Julio, 2010 por ashirley

Mostrar 1 comentarios más

Answer 1

2 Respuestas

Answer 2

8voto

user568458 Puntos 149

Pues bien, existe al menos un problema no convexo, que podemos resolver de forma exacta y rápida: la aproximación de rango inferior. Encontrar la matriz $B$ tal que $rank(B)=k$ "más cercano" a la matriz $A$ de rango $m>k$ . Ese problema se puede resolver con la SVD.

Respondido el 5 de Junio, 2011 por user568458 (149 Puntos )

Answer 3

1voto

Kondybas Puntos 2645

Por supuesto, generalmente la optimización es NP-dura. Sin embargo, hay un par de trucos que se pueden utilizar en el caso no convexo. En primer lugar, si $d$ es la dimensión del dominio, la probabilidad de que, por ejemplo, el descenso por gradiente se atasque en un mínimo local disminuye exponencialmente a medida que $d \rightarrow \infty$ Por lo tanto, el principal obstáculo son, en este caso, los puntos de silla de montar.

Para escapar de los puntos de silla se puede utilizar el método de Newton modificado, que, en lugar de dar pasos $-\alpha H^{-1}\nabla f$ toma medidas de $-\alpha |H|^{-1}\nabla f.$

Este es el llamado Newton sin silla de montar, que requiere $O(d^3)$ tiempo para dar un paso (la inversión de la matriz es lenta). Se puede utilizar una versión que aproxime el subespacio que contiene los vectores propios correspondientes a los valores propios más grandes (en valor absoluto) con una técnica similar al procedimiento de Lanzchos. La restricción de tiempo se convierte en $O(kd)$ para alguna constante $k.$

Ambos métodos fueron introducidos y probados en este artículo: https://arxiv.org/abs/1406.2572

En cuanto a la aplicación pública, aquí hay una: https://github.com/smdrozdov/saddle_free_newton

Respondido el 25 de Febrero, 2019 por Kondybas (2645 Puntos )

¿Todas las optimizaciones no convexas son heurísticas?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Todas las optimizaciones no convexas son heurísticas?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: