En primer lugar, permítanme dar el contexto: Dado que es un operador unitario $U \in L(H)$ (en realidad $\|U\| \leq 1$ es suficiente) en un espacio de Hilbert y $P$ es la proyección ortogonal sobre el subespacio $V = \{x \in H\,:\, Ux=x\}$ fijo de vectores de $U$. El von Neumann significa ergodic teorema afirma que para todos los $x \in H$ hay convergencia de la Cesàro promedios de $U^{k}x$ $Px$en la norma:
\[
\left\Vert Px - \frac{1}{n+1} \sum_{k = 0}^{n} U^{k}x\right\Vert \; \xrightarrow{n \to \infty} \; 0.
\]
En otras palabras, la secuencia de operadores de $\frac{1}{n+1} \sum_{k = 0}^{n} U^{k}$ converge a $P$ en el fuerte del operador de la topología en $L(H)$. Por supuesto, la convergencia en el fuerte del operador de la topología es la misma que pointwise convergencia de los operadores en $H$, pero prefiero no hablar de pointwise convergencia debido a que esto puede ser confuso cuando se habla de una función de espacio como $H = L^{2}$.
Spoiler: tenga en cuenta que si usted tiene que, el ejercicio ya está resuelto porque se puede multiplicar con $U^{M}$ dentro de la norma y escribir $N = n+M$ (o preferentemente hacia atrás).
No estoy seguro de qué tipo de respuesta que usted está buscando. Formalmente, el resultado se parece más fuerte, pero es equivalente, como se dio cuenta y me sostuvo en el spoiler de arriba.
Creo que ya estamos bastante cerca de la intuición que tengo sobre esto.
Deje $S_{m}^{n} = \frac{1}{n-m+1}\sum_{k = m}^{n} U^{k}$ $n \geq m$ ($+1$ es algo inmaterial, pero debe quedar claro a partir de las cosas que quiero decir a continuación por qué prefiero a agregar). Este es un triangular doble secuencia de operadores en $L(H)$. Como usted dice, teniendo en $m = \text{const}$ tiene convergencia $\|S_{m}^{n}f - Pf\| \xrightarrow{n \to \infty} 0$. Ahora sólo tienes que requieren $(n-m) \to \infty$ significa que sólo el aumento de la longitud de las colas de los asuntos con el tiempo.
Para mí es un poco más abstracto postura es útil, pero esto puede ser debido al hecho de que he pensado en la conveniencia demasiado. Me voy a dar una breve reseña de este punto de vista, de todos modos:
El Cesàro promedios de probabilidad de medidas en el abelian semi-grupo $\mathbb{N}$, es decir,$\mu_{n} = \frac{1}{n+1}\sum_{k=0}^{n} \delta_{k}$. El cambio de $Sk = k+1$ $\mathbb{N}$ actúa sobre la probabilidad de medidas y
\[
\|S\mu_{n} - \mu_{n}\| = \|\frac{1}{n+1} (\delta_{n+1} - \delta_{0})\| \leq \frac{2}{n+1} \to 0,
\]
donde la norma se entiende como el total de la variación de la norma (o $\ell^{1}$-norma).
Ahora, en general, una secuencia $(\lambda_{n})$ (o incluso una red) de medidas de probabilidad en $\mathbb{N}$ se llama aproximadamente invariante (o una Reiter secuencia) si
$\|S\lambda_{n} - \lambda_{n}\| \to 0$.
Por otro lado, la semigroup $\mathbb{N}$ actúa en $H$$n \ast x = U^{n}x$. Empujando la probabilidad de medidas hacia adelante a través de la órbita de mapa, se consigue una acción en $H$ por la convolución semigroup $P(\mathbb{N})$ de probabilidad de medidas en $\mathbb{N}$. Explícitamente, $\mu \ast x = \sum_{n \in \mathbb{N}} \mu(n) U^{n} x$.
Deje $(\lambda_{n})$ aproximadamente invariante de la secuencia (o red) de la probabilidad de medidas. Entonces
\[
\|\lambda_{n} \ast (Ux - x)\| = \| (S\lambda_{n}) \ast x - \lambda_{n} \ast x\| \leq \|S\lambda_{n} - \lambda_{n}\|\,\| x\|\;\xrightarrow{n \to \infty} \;0
\]
para todos los $x \in H$. Deje $W$ ser cerrada lineal útil de los vectores $Ux - x$. Acabamos de ver que $\lambda_{n} \ast w \to 0$ todos los $w$ en un subespacio denso de $W$, por lo tanto para todos los $w \in W$.
Por otra parte, no es difícil comprobar que $W^{\perp} = V = \{x \,:\,x = Ux\}$. De hecho, si $y \in W^{\perp}$ $0 = \langle y, x - Ux \rangle = \langle y - U^{\ast}y, x\rangle$ todos los $x \in H$, lo $y = U^{\ast}y$ y, por tanto, $Uy = y$ porque $U$ es unitaria. Por lo tanto, $V \supset W^{\perp}$ y la otra inclusión es clara.
Para cada $x \in H$ tenemos $x = Px + (1-P)x$$Px \in V$$(1-P)x \in W$. Por lo tanto, $\lambda_{n} \ast x = \lambda_{n} \ast Px + \lambda_{n} \ast (1-P)x = Px + \lambda_{n} \ast (1-P)x \to Px$ y hemos demostrado que la siguiente versión de la media ergodic teorema:
Teorema. Si $(\lambda_{n})$ aproximadamente invariante de la secuencia (o red) de medidas de probabilidad en $\mathbb{N}$ $\lambda_{n} \ast x = \sum_{k \in \mathbb{N}} \lambda_{n}(k) U^{k}x$ converge a $Px$.
Por último, vuelvo a su pregunta específica. Los operadores de $S_{m}^{n}$ son fácilmente visto surgir de la probabilidad de medidas de $\lambda_{m}^{n} = \frac{1}{n-m+1} \sum_{k=m}^{n} \delta_{k}$, que es una red mediante orden lexicográfico y es de aproximadamente invariante siempre que $(n-m) \to \infty$.