Deje p(x1,x2,x3) ser una función escalar. El objetivo es encontrar a x1,x2,x3 a minimizar p(x1,x2,x3). Ahora, considere el método de gradiente de la pendiente: (x1x2x3)k+1=(x1x2x3)k−αk(∂p∂x1∂p∂x2∂p∂x3)k donde αk es el tamaño del paso.
Mi pregunta es: ¿puede el anterior proceso iterativo llevarse a cabo de manera distribuida? Esto podría estar motivado por algunas razones, tales como, distribuidos de recursos computacionales. La siguiente es mi opinión acerca de este problema.
Reescribir la ecuación anterior para x1,k+1=x1,k−α1,k∂p∂x1 x2,k+1=x2,k−α2,k∂p∂x2 x3,k+1=x3,k−α3,k∂p∂x3 A continuación, las tres ecuaciones que puede ser calculado en tres equipos, respectivamente. Aquí tengo una pregunta, ¿el tamaño del paso, α1,k,α2,k,α3,k importa? Debemos mantener el α1,k=α2,k=α3,k?? En otras palabras, es el siguiente ecuación de gradiente de la pendiente? Si α1,k,α2,k,α3,k son diferentes el uno del otro, el movimiento global no es siempre a lo largo de con ∇xp(x). (x1x2x3)k+1=(x1x2x3)k−(α1,k000α2,k000α3,k)(∂p∂x1∂p∂x2∂p∂x3)k