7 votos

Metamatemática de las consecuencias de los espacios de Banach del teorema de la categoría de Baire

Mi pregunta se refiere a un comentario en la presentación de Tao sobre el Principio de Limitación Uniforme, el teorema del Mapa Abierto y el teorema del Grafo Cerrado en su entrada del blog 245B, Notas 9: El teorema de la categoría Baire y sus consecuencias en los espacios de Banach . Dice que normalmente las direcciones "fáciles" de los teoremas se utilizan en la práctica, mientras que las direcciones "difíciles" proporcionan una justificación metamatemática del enfoque.

Estrictamente hablando, estos teoremas no se utilizan mucho directamente en la práctica, porque se suele trabajar en la dirección inversa (es decir, primero se prueban los límites cuantitativos y luego se derivan los corolarios cualitativos); pero los tres teoremas anteriores ayudan a explicar por qué solemos abordar los problemas cualitativos en el análisis funcional a través de sus homólogos cuantitativos.

A pesar de que me han dado tres ejemplos de este fenómeno, sigo sin entender en absoluto a qué se refiere. Los ejemplos están abajo, y he añadido la negrita para resaltar lo que no entiendo. ¿Podría alguien ampliar la información, tal vez con un ejemplo más sencillo? Soy consciente de que no se trata de un concepto lógico formal, pero no entiendo lo que dice.


En la discusión que sigue al ejemplo 1 (fórmula de inversión de Fourier por acotación uniforme), Tao escribe

Este argumento sólo utilizó la implicación "fácil" del Corolario 1, es decir, la deducción de 2. a partir de 3. La implicación "dura" que utiliza el teorema de la categoría de Baire no se utilizó directamente. Sin embargo, desde un punto de vista metamatemático, esa implicación es importante porque nos dice que la estrategia anterior para demostrar la convergencia en norma de la fórmula de inversión de Fourier en $L^2$ - es decir, obtener normas de operadores uniformes en las sumas parciales, y establecer la convergencia en una subclase densa de funciones "agradables" - está en algún sentido la única estrategia disponible para probar tal resultado.

En la Observación 5 que sigue al Principio de Mapeo Abierto, Tao escribe

El teorema del mapa abierto proporciona una justificación metamatemática para el método de las estimaciones a priori para resolver ecuaciones lineales como $Lu = f$ para un dato determinado $f \in Y$ y para un desconocido $u \in X$ que es, por supuesto, un problema familiar en la EDP lineal. El método a priori supone que $f$ está en alguna clase densa de funciones agradables (por ejemplo, funciones suaves) en la que la solvencia de $Lu=f$ es presumiblemente fácil, y luego procede a obtener la estimación a priori $\|u\|_X \leq C \|f\|_Y$ para alguna constante $C$ . El teorema 3 asegura entonces que $Lu=f$ es solucionable para todos los $f$ en $Y$ (con un límite similar). Como antes, esta implicación no utiliza directamente el teorema de la categoría Baire, pero ese teorema ayuda a explicar por qué este método "no tiene desperdicio".

Finalmente, siguiendo el Teorema del Grafo Cerrado Tao escribe

En la práctica, hay que pensar en $Z$ como una especie de espacio de "baja regularidad" con una topología débil, y $Y$ como un subespacio de "alta regularidad" con una topología más fuerte. El corolario 3 motiva el método de las estimaciones a priori para establecer el $Y$ -regularidad de alguna transformada lineal $Tx$ de un elemento arbitrario $x$ en un espacio de Banach $X$ estableciendo primero la estimación a priori $\|Tx\|_Y \leq C \|x\|_X$ para una subclase densa de elementos "agradables" de $X$ y luego utilizando el corolario anterior (y cierta continuidad débil de $T$ en un espacio de baja regularidad) para concluir. El teorema del grafo cerrado proporciona la explicación metamatemática de por qué este enfoque es al menos tan potente como cualquier otro para demostrar la regularidad.

4voto

hendreyth Puntos 46

Los comentarios en negrita son un punto relativamente sencillo que se hace complejo por lo abstracto del tema. Dejando de lado la complejidad matemática, supongamos que tenemos una propiedad interesante, Y, que es difícil de verificar directamente. Lo que normalmente queremos hacer en este caso es encontrar alguna propiedad X más fácil de verificar que proporcione una suficiente condición para Y (es decir, si algo tiene la propiedad X tiene la propiedad Y). Ahora, esto nos da un buen método para verificar que algo tiene la propiedad Y (difícil) verificando primero que tiene la propiedad X (fácil). Esto, por supuesto, funcionará para cualquier caso en el que el objeto tenga de hecho la propiedad X. Pero todavía queda la pregunta: ¿Existe un método más potente para verificar la propiedad Y? Si todo lo que hemos demostrado es que X es suficiente, pero no necesario, puede haber alguna propiedad, Z, más débil que X que también sea suficiente para Y; entonces verificar Z es un método más potente para verificar Y. Por lo tanto, en esta situación, esto seguiría siendo un área de investigación matemática activa, tratando de encontrar métodos más potentes para verificar que los objetos tienen la propiedad Y.

Sin embargo, si podemos demostrar que X no sólo es suficiente sino que necesario para Y, entonces sabemos que podemos dejar de buscar métodos más potentes. Esencialmente, ya que cualquier cosa con la propiedad Y tiene la propiedad X, y X es fácil de verificar, entonces Y se ha convertido en fácil de verificar.

Por poner un ejemplo trivial: Es útil saber que dos puntos son suficientes para determinar la ecuación de una recta, esto (o más bien el método para determinar la ecuación) es algo que la gente utiliza todo el tiempo. Que 2 puntos son necesario (en el sentido de que 1 punto es insuficiente) no es un hecho que vayas a utilizar muy a menudo, pero te permite dejar de preocuparte por si hay algún método elegante para determinar las ecuaciones de las líneas que se te escapa.

3voto

ctoi Puntos 416

Creo que hay varias razones por las que este enfoque es útil, como lo que dijo Hendreyth en su respuesta. En mi respuesta quiero abordar la siguiente cuestión:

¿Por qué deberíamos esforzarnos en demostrar un resultado más fuerte, cuando podemos simplemente demostrar la condición más débil y apelar a los tres teoremas? En muchos sentidos, no tiene sentido utilizar la dirección más fácil de los teoremas, que son básicamente trivialidades en los tres casos. A primera vista, no parece haber ningún beneficio aparente en tratar de demostrar el resultado más fuerte.

Creo que la razón es que estas estimaciones cuantitativas precisas son más útiles en general para establecer otros resultados sobre el operador en cuestión. A veces las conclusiones de estos teoremas no son suficientes para establecer lo que realmente queremos saber, y resulta que las estimaciones cuantitativas nos permiten deducir conclusiones más fuertes. Por otra parte, en las aplicaciones se puede estar estudiando un sistema muy particular, por lo que disponer de estas estimaciones puede ayudar a comprender un aspecto diferente del sistema.

Tomando el ejemplo de la inversión de Fourier $L^2,$ Obsérvese que basta con demostrar que la secuencia $S_N(f)$ está acotado para todo $f \in L^2,$ de la que se desprende un límite uniforme. Sin embargo, esto no indica que el mapeo sea de hecho una isometría, que es una condición mucho más fuerte que la simple invertibilidad.

Hay que tener en cuenta que esto no se encuentra en un curso de introducción al análisis funcional, que adopta un punto de vista más abstracto en cierto sentido. Creo que esto sólo tiene sentido en las aplicaciones, donde se tiene un sistema concreto a partir del cual se pueden establecer estimaciones explícitas.


Un ejemplo más complicado, pero espero que más ilustrativo, es el siguiente: Consideremos el problema de resolver una EDP elíptica lineal de segundo orden de la forma $Lu = f$ en algún dominio acotado $\Omega$ con condiciones de contorno cero. Aquí vemos $L$ como un operador que mapea entre espacios de Hölder $C^{2+\alpha}(\Omega) \rightarrow C^{\alpha}(\Omega)$ (los detalles no son demasiado importantes aquí).

Una forma de establecer la invertibilidad es a través del llamado método de continuidad. Supondremos que podemos resolver la ecuación de Poisson $\Delta u = f,$ por lo que existe una inversa acotada $\Delta^{-1}: C^{\alpha}(\Omega) \rightarrow C^{2+\alpha}(\Omega).$ Entonces lo fijamos, $$ L_t = (1-t) \Delta + t L$$

para $0 \leq t \leq 1.$ Sabemos que $L_0 = \Delta$ es invertible y queremos utilizarlo para demostrar que $L_1 = L$ es invetible. Ahora, debería estar claro que no podemos hacer esto sin saber un poco más sobre el operador $L,$ pero, no obstante, podemos intentar proceder mediante argumentos generales.

Set $S = \{ t \in [0,1] : L_t\ \text{is invertible} \},$ que no está vacío, ya que $0 \in S.$ Ahora bien, dado $s \in S,$ dejar $t \in [0,1]$ y $f \in C^{\alpha}(\Omega).$ Queremos encontrar una solución a la ecuación $L_tu=f,$ por lo que definimos $T : C^{2+\alpha}(\Omega) \rightarrow C^{2+\alpha}(\Omega)$ enviando,

$$ Tu = L_s^{-1}f + u + L_s^{-1}L_tu = L_s^{-1}f + L_s^{-1}(L_s-L_t)u. $$

Tenga en cuenta que $Tu = u$ si y sólo si $L_tu =f.$ Para demostrar que existe un punto fijo, demostraremos que $T$ es una contracción de $|s-t|$ lo suficientemente pequeño. En efecto, tenemos,

$$ \lVert Tu - Tv \rVert = \lVert L_s^{-1}(L_s-L_t)(u-v) \rVert \leq \lVert L_s^{-1} \rVert \lVert \Delta - L \rVert |s-t| \lVert u - v \rVert.$$

Así que esta estimación nos dice que $T$ es una contracción de $|s-t| \leq 1/(2\lVert L_s^{-1} \rVert \lVert \Delta - L \rVert).$ Por lo tanto, por el teorema de los mapas de contracción, tenemos para todo $t$ lo suficientemente cerca de $L,$ la ecuación $L_t u = f$ admite una solución única para todos $f \in C^{\alpha}(\Omega).$ Así, por el teorema del mapa abierto es invertible, que establece que $S$ está abierto.

En este punto podemos hacer algunas observaciones:

  • Demostramos que para un tamaño suficientemente pequeño $s,$ $L_s$ es invertible.

  • De hecho, este argumento es mucho más general: demostramos que una pertubación suficientemente pequeña de un operador invertible sigue siendo invertible.

  • Este argumento nos da un resultado local, pero no podemos extenderlo para demostrar que $S$ contiene todos los $[0,1].$ El problema es que no tenemos un control uniforme sobre $\lVert L_s^{-1} \rVert,$ que puede explotar como $s$ se acerca a un punto límite de $S.$

Aquí es donde las estimaciones cuantitativas resultan útiles. Con los supuestos adecuados sobre $L,$ se puede probar la llamada _Schauder estima que_ existe una constante $C>0,$ independiente de $t$ y $u$ tal que,

$$ \lVert u \rVert_{C^{2+\alpha}(\Omega)} \leq C\lVert L_t u \rVert_{C^{\alpha}(\Omega)}. $$

Establecer esta estimación requiere mucho trabajo y aprovecha al máximo la estructura exacta del operador $L.$ Sin embargo, el resultado es un límite uniforme para la cantidad $1/(2 \lVert L_s^{-1} \rVert \lVert \Delta - L \rVert),$ a partir de la cual podemos establecer $S=[0,1],$ por un argumento de compacidad (observando el límite de $|s-t|$ que necesitábamos antes puede establecerse ahora de manera uniforme en $s$ y $t$ ).

Nótese que las estimaciones de Schauder sustituyen el uso del teorema de los mapas abiertos, por lo que este resultado se mantiene sin utilizar la categoría Baire. Sin embargo, la conclusión que obtenemos es mucho más fuerte, debido a la información adicional codificada en nuestras estimaciones (es decir, que el límite es independiente de $t$ ).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X