Supongamos que $\lambda(A)<\infty$ .
En primer lugar, sabemos que la medida de Lebesgue es sólo una restricción de la medida exterior a conjuntos medibles, es decir, como también has escrito $\lambda(A)=\lambda^*(A)$ para medir $A$ . No necesitamos demostrarlo. Esta es la definición de $\lambda$ .
No puede elegir un el más pequeño cubriendo por intervalos porque no se puede tomar el ínfimo.
Es como si se tomara el ínfimo del conjunto $\{1/n\,:\,n\in\mathbb{N}\}$ (que es $0$ ): $1/n$ recibirá realmente, realmente cerca de $0$ como $n$ consigue realmente, realmente grande, pero nunca llegará a cero. En el momento en que elijas uno de los $1/n$ 's y declararlo el "más pequeño" pierdes porque sigues siendo infinitamente muchos $n$ 's lejos de $0$ . Pero puede elige un $\epsilon>0$ y decide que es lo lejos que quieres aproximarte $0$ y luego el definición del ínfimo le da un $n$ tal que $1/n-0<\epsilon$ .
Ahora hagamos lo mismo aquí. Elija $\epsilon>0$ . Por la definición del mínimo, existe una secuencia de intervalos abiertos $(I_n)_n$ cubierta $A$ tal que
$$\sum_{n=1}^\infty l(I_n)-\lambda(A)<\epsilon$$
Ahora escribe $O=\bigcup_{n=1}^\infty I_n$ . $O$ es abierto como unión de intervalos abiertos. Por la subaditividad de la medida de Lebesgue
$$\lambda(O)\le \sum_{n=1}^\infty l(I_n)$$
Todo esto podríamos haberlo hecho también sin asumir la mensurabilidad de $A$ ya que también la medida exterior $\lambda^*$ es subaditivo.
El paso crucial ahora, que usted también ya hizo, utiliza la mensurabilidad de $A$ (esto sigue literalmente del clásico Definición de Carathéodory de mensurabilidad, aunque no sé si lo usaste para definir mensurabilidad, ¡así que búscalo si no!):
$$\lambda(O)=\lambda(A)+\lambda(O- A)$$
Esto implica
$$\lambda(O-A)=\lambda(O)-\lambda(A)\le \sum_{n=1}^\infty l(I_n) - \lambda(A)<\epsilon$$
que es lo que queríamos probar. Lo interesante es que también se puede utilizar esta propiedad (llamada regularidad externa de la medida de Lebesgue) para defina mensurabilidad y derivar de ella la definición de Carathéodory (puede haber algunas subletades con todos los conjuntos de medida $0$ medible o no, pero no entremos en esto ahora).
Edita:
Todo esto fue por el caso $\lambda(A)<\infty$ . Si $\lambda(A)=\infty$ tenemos que elegir un agotamiento de $A$ por conjuntos compactos, es decir
$$A_k=\{x\in A\,:\,|x|\le k\}$$
entonces $\lambda(A_k)<\infty$ y $\bigcup_{k=1}^\infty A_k=A$ . Aplicamos el argumento anterior para obtener una secuencia de conjuntos abiertos $(O_k)_k$ con la propiedad
$$\lambda(O_k-A_k)\le \frac{\epsilon}{2^k}$$
Ahora defina $O=\bigcup_{k=1}^\infty O_k$ . Entonces
$$\lambda(O-A)=\lambda\left(\bigcup_{k=1}^\infty (O_k-A)\right)\le \sum_{k=1}^\infty \lambda(O_k-A)\le \sum_{k=1}^\infty \lambda(O_k-A_k)\le \epsilon$$