En mi libro de introducción al análisis de series temporales el operador backshift $\mathbf{B}$ se introduce mediante la siguiente definición: $$ \mathbf{B}x_t=x_{t-1} $$ Luego el autor se pone a derivar algunas propiedades de los paseos aleatorios, y hay este paso, que es un completo misterio para mí: $$ x_t=(1-\mathbf{B})^{-1}w_t\Rightarrow x_t=(1+\mathbf{B}+\mathbf{B}^2+\mathbf{B}^3+\dots)w_t $$
No entiendo cómo $(1-\mathbf{B})^{-1}$ equivale a $(1+\mathbf{B}+\mathbf{B}^2+\mathbf{B}^3+\dots)$ . Tal vez en el libro el autor no proporcionó algunas propiedades importantes del operador backshift que se utilizaron derivando el paso anterior.