Deje $A$ $B$ ser cualquiera de los dos operadores en el espacio de Hilbert $\mathscr H$, hermitian o no. Asumimos $A, B \in L(\mathscr H)$, el álgebra de Banach delimitada lineal mapas de $\mathscr H$ a sí mismo. Considere el operador lineal ecuación diferencial ordinaria
$\dfrac{dX}{d \lambda} = [B, X] \tag{1}$
con condición inicial
$X(0) = A. \tag{2}$
Observamos que
$X(\lambda) = e^{\lambda B}Ae^{-\lambda B} \tag{3}$
es la única solución de (1), (2), de (3) se deduce que
$\dfrac{dX}{d \lambda} = \dfrac{e^{\lambda B}}{d \lambda}Ae^{-\lambda B} + e^{\lambda B}\dfrac{dA}{d \lambda}e^{-\lambda B} + e^{\lambda B}A\dfrac{e^{-\lambda B}}{d \lambda} =$
$Be^{\lambda B}Ae^{-\lambda B} - e^{\lambda B}Ae^{-\lambda B}B = [B, e^{\lambda B}Ae^{-\lambda B}], \tag{4}$
donde hemos utilizado el hecho de que $dA / d \lambda = 0$ y la de Leibniz, producto de la regla de derivados en (4), y además es evidente a partir de (3)$X(0) = A$.
Estamos próximos a recordar que para cualquier $B \in L(\mathscr H)$ el adjunto lineal operador $\text{ad}_B: L(\mathscr H) \to L(\mathscr H)$ puede ser definido a través de
$\text{ad}_B(A) = [B, A] \tag{5}$
para todos los $A \in L(\mathscr H)$. Denotando por $\Vert T \Vert _L$ el operador estándar de la norma en $L(\mathscr H)$, vemos que
$\Vert \text{ad}_B(A) \Vert_L = \Vert [B, A] \Vert_L = \Vert BA - AB \Vert_L \le \Vert BA \Vert_L + \Vert AB \Vert_L$
$\le \Vert B \Vert_L \Vert A \Vert_L + \Vert A \Vert_L \Vert B \Vert_L = 2 \Vert B \Vert_L \Vert A \Vert_L, \tag{6}$
lo que muestra que
$\Vert \text{ad}_B \Vert_L \le 2 \Vert B \Vert_L, \tag{7}$
es decir, que $\text{ad}_B \in L(\mathscr H)$ es en sí mismo un delimitada lineal operador de la norma en la mayoría de las $2\Vert B \Vert_L$. Además, hemos
$\text{ad}_B^2(A) = \text{ad}_B (\text{ad}_B(A)) = \text{ad}_B([B, A]) = [B, [B, A]], \tag{8}$
$\text{ad}_B^3(A) = \text{ad}_B (\text{ad}_B^2(A)) = \text{ad}_B([B, [B, A]]) = [B, [B, [B, A]]], \tag{9}$
y así sucesivamente:
$\text{ad}_B^n(A) = [B, [B, [B, . . . [B, A]]] . . . ], \tag{10}$
donde el operador $\text{ad}_B = [B, \cdot]$ se produce un total de $n$ veces en el lado derecho de (10). Vemos que, de hecho, (1) puede ser escrita en términos de $\text{ad}_B$
$\dfrac{dX}{d \lambda} = \text{ad}_B(X). \tag{11}$
Ahora establecer
$Y(\lambda) = A + \lambda [B, A] + \dfrac{\lambda^2}{2!}[B, [B, A]]$
$+ \ldots + \dfrac{\lambda^n}{n!}\underbrace{[B, [B, [B, \ldots [B}_{n \; \text{times}}, A]]]] \ldots ] + \ldots; \tag{12}$
a partir de lo anterior, podemos ver que $Y(\lambda)$ puede ser escrito
$Y(\lambda) = A + \lambda \text{ad}_B(A) + \dfrac{\lambda^2}{2!} \text{ad}_B^2(A) + \ldots + \dfrac{\lambda^n}{n!} \text{ad}_B^n(A) + \ldots$
$= \sum_0^\infty \dfrac{\lambda^n}{n!}\text{ad}_B^n(A) + \ldots = e^{\lambda \text{ad}_B}(A); \tag{13}$
dado por (7) $\text{ad}_B$ es un operador acotado en $L(\mathscr H)$, todas las series que ocurren por encima de converge absoluta y uniformemente en compacta para todas las $\lambda \in \Bbb R$, de hecho para todos los $\lambda \in \Bbb C$. Así tenemos, exactamente como en el caso de las ordinarias del cálculo, de la que el derivado $Y'(\lambda)$ está dado por
$\dfrac{dY}{d\lambda} = \text{ad}_B(e^{\lambda \text{ad}_B}(A)) = [B, e^{\lambda \text{ad}_B}(A)], \tag{14}$
y además
$Y(0) = A, \tag{15}$
que sigue trivialmente a partir de (12) y (13). Comparar (1), (2), (11), (14) y (15), podemos ver que $X(\lambda)$$Y(\lambda)$, satisfactorio como lo hacen la misma educación a distancia con las mismas condiciones iniciales, debe, por su singularidad, etc. ser idéntico para todos $\lambda$: $X(\lambda) = Y(\lambda)$. Usando (3) y (12), (13) así vemos que
$e^{\lambda B}Ae^{-\lambda B} = e^{\lambda \text{ad}_B}(A)$
$= A + \lambda [B, A] + \ldots + \dfrac{\lambda^n}{n!}\underbrace{[B, [B, [B, \ldots [B}_{n \; \text{times}}, A]]]] \ldots ] + \ldots; \tag{16}$
si ahora nos set $B = iG$ obtenemos
$e^{i\lambda G}Ae^{-i\lambda G} = e^{i\lambda \text{ad}_G}(A)$
$= A + i\lambda [G, A] + \ldots + \dfrac{(i\lambda)^n}{n!}\underbrace{[G, [G, [G, \ldots [G}_{n \; \text{times}}, A]]]] \ldots ] + \ldots, \tag{17}$
donde hemos utilizado el hecho de que $\text{ad}_{iG} = i\text{ad}_G$, consecuencia de la linealidad de la abrazadera de $[G, A]$ en cada una de sus variables $A, G$. La ecuación (17) es el resultado deseado. QED.
Nota: La técnica utilizada aquí, que se basa en la unicidad de las ecuaciones diferenciales ordinarias, es similar en espíritu a la que se utiliza en mis respuestas a varias preguntas; en particular ver este y este.
Otra Nota: Un par de interesantes fórmulas relacionados con los anteriores: $[B, e^{\lambda B}Ae^{-\lambda B}] = e^{\lambda B}[B, A]e^{-\lambda B}$$A = e^{-\lambda B} e^{\lambda \text{ad}_B(A)} e^{\lambda B}$.
Espero que esto ayude. ¡Hasta la vista,
y como siempre,
Fiat Lux!!!