50 votos

El lema de Zorn: ¿viejo amigo o reliquia histórica?

A menudo se dice que, en lugar de demostrar un gran teorema, el mayor sueño de un matemático es demostrar un gran lema. Algo como el lema del árbol de Konigs, o el lema de Yoneda, o realmente cualquier cosa de esta lista .

Cuando empezaba a aprender álgebra, uno de los lemas clave que nos enseñaban era Lema de Zorn . Su poder y utilidad eran casi mágicos. Sin embargo, no recuerdo la última vez que el lema de Zorn apareció en uno de mis trabajos (y eso que soy algebrista). Reflexionando sobre el porqué de esto, se me ocurrieron algunas razones, que enumero a continuación. No quiero perder a mi viejo amigo Zorn, así que mi pregunta es:

¿Cuáles son algunas de las razones para mantener (o, tal vez de acuerdo con mis pensamientos, abandonar) el lema de Zorn?

Editado para añadir : Uno de los propósitos de esta pregunta es saber si debería o no reescribir mis pruebas para utilizar el lema de Zorn, en lugar de mi práctica habitual de utilizar la recursividad transfinita, si hay una razón matemática para preferir uno sobre el otro. Espero que esto aclare el contenido matemático de esta pregunta.


Para motivar la discusión, permítanme dar un ejemplo de cómo enseñaría ahora a los no licenciados un resultado que me enseñaron utilizando el lema de Zorn.

Teorema : Todo espacio vectorial $V$ tiene una base.

Prueba : En primer lugar, fije una ordenación adecuada para $V$ . Recurriremos a la ordenación para decidir si mantenemos o descartamos elementos de $V$ . Supongamos que hemos llegado a un vector $v$ lo conservamos si es linealmente independiente de los vectores anteriormente conservados (es decir, si no se encuentra en su tramo); en caso contrario, lo descartamos. Si $B$ es el conjunto de vectores mantenidos vemos que es una base como sigue. Cualquier vector $v\in V$ está en el tramo de $B$ porque está en $B$ o en el ámbito de los vectores conservados anteriormente. Por otra parte, los elementos de $B$ son linealmente independientes porque una combinación no trivial $c_1 v_1 + \cdots +c_k v_k=0$ donde $v_1<v_2<\ldots<v_k$ et $c_k\neq 0$ puede reordenarse de la siguiente manera $v_k$ es una combinación lineal de los vectores anteriores, por lo que $v_k$ no puede pertenecer a $B$ después de todo. $\quad\square$

He aquí algunas de las ventajas que le veo a este tipo de prueba sobre el argumento habitual del lema de Zorn.

1. El uso de la elección se desvincula de las demás partes de la prueba.

Al aplicar el lema de Zorn, es difícil ver exactamente cómo se utiliza el axioma de elección para llegar a la conclusión de un elemento maximal. Una forma de visualizar su uso es que el lema de Zorn nos permite construir recursivamente una cadena maximal a través del poset. Esta cadena debe tener un elemento mayor. Sin embargo, esta construcción se oculta tras las palabras mágicas "Abracadabra Zornify".

¿Es un artefacto histórico que la elección se oculte de esta manera?

2. Podemos ver más fácilmente si utilizar o no un principio de elección.

En la prueba anterior, si $V$ ya es bien ordenable (sin AC), entonces no necesitamos utilizar nunca el axioma de elección.

3. El lema de Zorn no es más fácil que la recursión transfinita.

Cada parte de la recursividad transfinita ya ocurre (implícitamente) en la mayoría de los argumentos del lema de Zorn. El caso base de la recursividad corresponde, grosso modo, a demostrar que el poset no es vacío (es decir, que tiene algún punto de partida). El paso ordinal sucesor suele ocurrir al final; después de afirmar que existe algún elemento maximal del poset, demostramos que este elemento maximal tiene alguna propiedad reivindicada trabajando por contradicción, y luego pasamos a un elemento ligeramente mayor del poset (es decir, el siguiente sucesor). El paso ordinal límite se produce cuando demostramos que las cadenas tienen límites superiores.

4. El lema de Zorn a menudo incluye complicaciones innecesarias.

En la prueba que he dado anteriormente, no hay necesidad de definir un conjunto complicado, junto con una relación poset. Podemos utilizar la inducción fuerte, para evitar la diferenciación entre el cero, sucesor, y los pasos límite distinto de cero. No necesitamos combinar la contradicción al final con ningún paso sucesor; están completamente separados.

5. La recursividad transfinita es un principio más fundamental.

Como cuestión de pedagogía, ¿no deberíamos enseñar a los alumnos la inducción transfinita antes de enseñarles una versión de la misma que también se combina con AC, y que requiere la construcción de un poset complicado?

6. La recursividad transfinita se aplica a situaciones en las que el lema de Zorn no lo hace.

Por poner sólo un ejemplo: Hay algunas recursiones que continúan a lo largo de todos los ordinales (durante un tiempo de clase adecuado). La de Zorn requiere, como hipótesis, un final.

59voto

thedeeno Puntos 12553

Estoy de acuerdo con casi todo lo que dice en su post. Pero aún así, creo que sé por qué la gente utiliza el lema de Zorn.

Mi respuesta. El lema de Zorn encapsula sucintamente muchas de las consecuencias de AC vía recursión transfinita, pero sin requerir ninguna implicación de los ordinales o conocimiento de recursión transfinita para ser utilizado.

Para quienes estén profundamente familiarizados con la recursividad transfinita, por supuesto, todo uso del lema de Zorn puede verse como una sumblimación de la construcción subyacente, que alcanza los elementos máximos mediante un proceso transfinito que explica simultáneamente por qué existen. Apelar a Zorn parece ocultar este mecanismo explicativo subyacente esencial.

Y sin embargo, la perspectiva alternativa es que el lema de Zorn se abstrae del proceso recursivo, produciendo al final un argumento más simple que se basa sólo en las consecuencias centrales del proceso recursivo, que no dependen de ningún compromiso explícito con los ordinales o la recursividad. Y precisamente por esa característica, los argumentos del lema de Zorn pueden ser asumidos y comprendidos por matemáticos que no estén familiarizados con los ordinales y la recursividad transfinita.

En el ejemplo del espacio vectorial, para demostrar que todo espacio vectorial tiene una base, se puede montar un proceso recursivo transfinito: se elige un elemento, y luego si no abarca, se elige otro, y así transfinitamente hasta tener una base. (Mi visión de este ejemplo es un poco diferente de cómo lo has descrito, ya que veo la función de elección como más primitiva que el orden de pozo - yo construiría la base eligiendo entre el elemento que aún no está en el span - de hecho prefiero ver el propio WOP como el resultado de elegir elementos recursivamente).

Con el lema de Zorn, sin embargo, no hay necesidad de ordinales o recursividad transfinita, y el argumento del lema de Zorn en su lugar encapsula abstractamente sus efectos - el orden parcial consiste en efecto en empresas parciales del proceso recursivo. En este sentido, el argumento de Zorn es más simple, abstrayéndose del "proceso" constructivo transfinito.

Me parece una situación análoga a la del axioma y el forzamiento de Martin. El axioma de Martin es el forzamiento del matemático pobre, igual que el lema de Zorn es la elección+recurrencia infinita del matemático pobre.

Mi opinión personal es que los ordinales y la recursividad transfinita son una de las maravillas de las matemáticas, un logro sublime del intelecto que da lugar a muchos argumentos y construcciones hermosos. Tiendo a preferir los argumentos recursivos transfinitos por proporcionar una explicación profunda de las consecuencias del lema de Zorn. (Incluso el teorema del buen orden parece fundamentalmente menos misterioso cuando se explica a través de la recursividad transfinita: elige un elemento cualquiera como elemento menor, y ahora elige un elemento siguiente, y otro siguiente, y así transfinitamente).

Además, aunque reconozco que muchos matemáticos tienen poca relación o experiencia con los ordinales y la recursividad transfinita, también creo que su vida matemática mejoraría si los conocieran más.

41voto

Venkata Koppaka Puntos 21

Estoy de acuerdo con las respuestas existentes, pero personalmente me gusta el lema de Zorn tanto pedagógica como matemáticamente por una razón adicional: el "poset de soluciones parciales" que introduce es una idea nueva y valiosa por derecho propio. Incluso cuando no tiene un elemento máximo por alguna razón -ya sea porque estamos trabajando en un contexto sin opciones o, más comúnmente, porque el poset no satisface las hipótesis de Zorn- puede seguir siendo una herramienta útil. En concreto, pienso en forzando argumentos como tal aplicación.

Así que para mí, el lema de Zorn se siente central por cómo enriquece la idea de los órdenes parciales más que por su papel como teorema-prover. Por supuesto, esto es subjetivo, pero la recursividad/inducción transfinita no tiene el mismo impacto para mí.


EDIT: En este contexto, por mucho que me gusten los bien ordenados, creo que la reacción a la recursividad/inducción transfinita descrita en Comentario de Timothy a la respuesta de Joel es comprensible. Si quiero usar TR/I para demostrar que existen ideales máximos, necesito elección para construir el ordenamiento adecuado (o función de elección), pero una vez que lo tengo todo está libre de elección. Por el contrario, el poset de soluciones parciales existe y es fácil de describir, sólo que en ausencia de elección podría no tener las propiedades que necesito. En caricatura, el lema de Zorn equivale a un análisis salvaje de un objeto sencillo, mientras que el enfoque TR/I es un análisis sencillo de un objeto salvaje.

19voto

KConrad Puntos 22631

Tu elección (ja) de demostrar la existencia de una base utilizando un bien ordenado en lugar del Lemma de Zorn da la vuelta a las cosas históricamente: la primera demostración de la existencia de bases algebraicas (utilizando sólo finito combinaciones lineales) en un ejemplo infinito-dimensional fue dado por Hamel en 1905 para $\mathbf R$ como $\mathbf Q$ -(su interés en esto era demostrar que hay mapas aditivos $\mathbf R \to \mathbf R$ que no sean de la forma $f(x)=cx$ ). Por ello, las bases de los espacios vectoriales en sentido algebraico se denominan bases de Hamel.

El artículo de Zorn que demuestra el lema de Zorn apareció en 1935. Pero muchos de los teoremas abstractos de existencia que se suelen demostrar hoy en día con el lema de Zorn ya se conocían antes de 1935 y se demostraron primero por inducción transfinitativa u ordenación adecuada. Por ejemplo, Steinitz demostró la existencia de un cierre algebraico de cada campo en 1910 utilizando el ordenamiento y Hahn y Banach demostraron (independientemente) la existencia de una extensión de funcionales lineales acotados a finales de los años 20 utilizando la inducción transfinita. En la Sección 6 se enumeran algunas pruebas originalmente controvertidas basadas en el axioma de elección. aquí y todavía hoy es habitual utilizar la elección directamente en algunas de esas pruebas (como el subconjunto no mensurable de los números reales de Vitali).

Mientras que usted puede sentir las pruebas que hacen un uso directo de una inducción bien ordenada o transfinito es más atractivo que el lema de Zorn, la formulación de estos enunciados equivalentes en una prueba como el lema de Zorn es más atractiva para otros, al menos psicológicamente: se considera más cómodo . (En última instancia, estas pruebas no son constructivas, independientemente del método que se utilice). $3$ ("El lema de Zorn no es más fácil que la inducción transfinita") no se confirma en la práctica: la mayoría de los matemáticos do creo que el lema de Zorn es más fácil. Se podría argumentar que esto sólo es cierto hoy en día porque todos los libros de texto modernos fuera de la teoría de conjuntos se han escrito para enfatizar el lema de Zorn sobre otros enfoques (hasta el punto de que los otros ni siquiera se mencionan excepto de pasada), pero la razón por la que están escritos de esta manera es porque los matemáticos de la era posterior a 1935 también pensaban que el lema de Zorn es más sencillo. Al fin y al cabo, muchos de los teoremas de existencia fundamentales que vemos hoy en día y que se demuestran mediante el lema de Zorn se demostraron primero mediante el buen orden o la recursividad transfinita. Pregúntese por qué se abandonaron esas pruebas originales.

El propósito del artículo de Zorn era ofrecer un nuevo principio que pudiera reemplazar el uso directo de la inducción transfinita, especialmente en álgebra, y lo consiguió: fuera de la teoría de conjuntos, las demostraciones que se hacían originalmente con ordenaciones o inducción transfinita ahora se hacen esencialmente con el lema de Zorn. Como indica Joel en su respuesta, las demostraciones que utilizan el lema de Zorn evitan la necesidad de desarrollar el material de base sobre los números ordinales y su ordenación. Podría decirse que ésta es la razón por la que las demostraciones mediante el lema de Zorn se han convertido en el enfoque dominante en matemáticas.

Aunque has dicho que, a diferencia de tu época de estudiante, no recuerdas la última vez que utilizaste el lema de Zorn, quizá hayas utilizado más recientemente resultados que son consecuencias del mismo (por ejemplo, los ideales maximales en un anillo conmutativo general distinto de cero o el cierre algebraico de un campo general o la extensión de un valor absoluto no arquimedeano de un campo a una extensión enorme de ese campo). Si es así, entonces su trabajo matemático seguiría basándose en ello. Considere también que el lema de Zorn es una herramienta popular para fundacional teoremas de existencia con gran generalidad en todas las matemáticas, y una vez que se superan los fundamentos se utilizan esos teoremas de existencia todo el tiempo en lugar de los métodos como el lema de Zorn que demostró esos teoremas de existencia. Por ejemplo, el resultado fundamental del análisis funcional es el teorema de Hahn-Banach. Se demuestra mediante el lema de Zorn en todos los libros de análisis funcional actuales, así que aunque un analista funcional no utilice directamente el lema de Zorn en su trabajo, lo está utilizando indirectamente cada vez que apela al teorema de Hahn-Banach.

13voto

Las respuestas y comentarios hasta ahora contienen mucha discusión abstracta y filosófica. Personalmente creo que, a la hora de comparar las ventajas e inconvenientes de dos enfoques, son importantes los ejemplos concretos. Así que daré uno aquí (en respuesta a la sugerencia del OP de un comentario ).

Comparemos cómo funcionan el lema de Zorn y la recursividad transfinita para el siguiente teorema (haré todo lo posible para hacer justicia a ambos enfoques en las pruebas, pero siéntete libre de mejorar).

Teorema. Sea $R$ sea un anillo distinto de cero con un elemento multiplicativamente neutro. Entonces existe un ideal maximal en $R$ .

Ambas pruebas necesitarán la siguiente observación, por lo que la externalizo en un lema:

Lema. Si $\mathcal{I}$ es un conjunto no vacío de ideales propios en $R$ que está totalmente ordenado con respecto a la inclusión de conjuntos, entonces $\bigcup \mathcal{I}$ es también un ideal propio en $R$ .

Demostración del lema. Fácil, y lo mismo para ambas pruebas a continuación. $\square$

Demostración del teorema mediante el lema de Zorn: Sea $\mathcal{J}$ denota el conjunto de todos los ideales propios de $R$ se trata de un poset con respecto a la inclusión de conjuntos. Obsérvese que $\mathcal{J}$ no está vacío, ya que contiene $\{0\}$ . Si $\mathcal{I} \subseteq \mathcal{J}$ es una cadena no vacía, entonces el lema implica que $\bigcup \mathcal{I} \in \mathcal{J}$ y claramente $\bigcup \mathcal{I}$ es un límite superior de $\mathcal{I}$ . Así que por el lema de Zorn $\mathcal{J}$ tiene un elemento maximal. $\square$

Demostración del teorema por recursión transfinita. Dote $R$ con un buen ordenamiento. Definimos recursivamente los ideales propios $I_r$ para cada $r \in R$ : supongamos que $I_s$ ya se ha definido para todos los $s < r$ . Si el ideal generado por $\bigcup_{s < r} I_s \cup \{r\}$ no es igual a $R$ definimos $I_r$ sea este ideal; esto es claramente correcto. Si no, definimos $I_r := \{0\}$ si $r$ es el elemento más pequeño de $R$ (así $I_r$ es correcto ya que $R \ne \{0\}$ ), y $I_r:= \bigcup_{s < r} I_s$ en cualquier otro caso; entonces $I_r$ es adecuada debido al lema.

La familia $(I_r)_{r \in R}$ es creciente, por lo que el lema implica que $I := \bigcup_{r \in R} I_r$ es un ideal propio. Si $t \in R$ no está en $I$ entonces $t \not\in I_t$ por lo que el ideal generado por $\bigcup_{s < t} I_s \cup \{t\}$ es $R$ y, por tanto, el ideal generado por $I \cup \{t\}$ es $R$ . Así, $I$ es máxima. $\square$

Si comparo ambas pruebas llego a la conclusión de que, en este ejemplo concreto, la prueba por el lema de Zorn es más corta y tiene menos sobrecarga técnica. Creo que esto ilustra una observación que se hace en el artículo de KConrad responder En algunos casos, los matemáticos prefieren utilizar el lema de Zorn, ya que hace que las pruebas sean menos técnicas.

(En caso de que haya complicado innecesariamente la prueba por recursión transfinita, por favor, siéntete libre de editarla).


(Editado para añadir una prueba de recursividad transfinita diferente escrita por Pace Nielsen)

Teorema : Sea $R$ sea un anillo distinto de cero con $1$ . Entonces existe un ideal maximal en $R$ .

Prueba . Dado un buen ordenamiento $(r_{\alpha})$ para $R$ establecemos recursivamente $$s_{\alpha}:= \left\{ \begin{matrix} r_{\alpha} & \text{ if }1\notin \langle r_{\alpha},s_{\beta}\ :\ \beta<\alpha\rangle\\ 0 & \text{ if }1\in \langle r_{\alpha},s_{\beta}\ :\ \beta<\alpha\rangle.\end{matrix}\right.$$ Lo ideal $M$ generado por el $s$ 's no es $R$ de lo contrario $1$ sería generado por un número finito mínimo de ellos $s_{\alpha_1},\ldots,s_{\alpha_k}$ con $\alpha_1<\ldots< \alpha_k$ . Esto contradice la minimalidad de $k$ si $s_{\alpha_k}=0$ (señalando que $k\neq 0$ desde $R\neq \{0\}$ ), de lo contrario se contradice directamente la definición de $s_{\alpha_k}$ . Además, ningún elemento nuevo puede unirse a $M$ sin generar el ideal trivial, por lo que $M$ es máxima. $\ \square$

(Si lo desea, también puede explicar por qué el ideal $M$ es igual al conjunto de $s$ elementos).

9voto

Brabster Puntos 18764

Antes de la inducción transfinita o el lema de Zorn, ya hay una elección con los números enteros. Puedes estudiar teoría elemental de números utilizando inducción débil (WI)

$$(\forall P \subseteq \mathbb N)\bigl((P(0) \wedge \forall n (P(n) \implies P(n+1))) \implies \forall n P(n)\bigr) \tag{*}\label{WI}$$

o utilizando el principio del número mínimo (LNP):

$$(\forall P \subseteq \mathbb N)\bigl(P = \emptyset \vee \exists n (P(n) \wedge \forall m (P(m) \implies n \leq m))\bigr). \tag{**}\label{LNP}$$

Observaciones:

  • Creo que WI se parece más a la inducción transfinita, y LNP al lema de Zorn.

  • Tengo la sensación de que WI es una opción pedagógica más común en este contexto que LNP.

  • No obstante, es posible enseñar teoría elemental de números invocando repetidamente LNP sin hablar nunca de WI. Por ejemplo, la Programa de Matemáticas de Ross adopta sistemáticamente este enfoque.

  • (Se me ocurre que LNP sólo dice que $\mathbb N$ está bien ordenada, mientras que WI también demuestra que $\mathbb N$ tiene tipo de orden $\omega$ . La afirmación más fuerte se deduce de LNP más el hecho de que $\mathbb N$ es un monoide conmutativo ordenado con adición cancelativa).

Ventajas e inconvenientes de WI frente a LNP

La filosofía en Ross es que los estudiantes entienden las cosas más profundamente utilizando la PNL en lugar de la IH.

  1. WI se siente mucho más como una "ley de razonamiento" separada, a la par con el modus ponens, mientras que LNP se siente mucho más como un "axioma", más a la par con la asociatividad de la multiplicación en un grupo. Creo que la mayoría de los matemáticos ajenos a la lógica aprenden más o menos las "leyes del razonamiento" básicas una vez, y luego las graban en piedra, mientras aprenden, inventan y consideran nuevos axiomas para nuevos objetos matemáticos, todo el tiempo. Les conviene mantener las "leyes del razonamiento" al mínimo, empaquetando tantos conceptos matemáticos como sea posible como "axiomas", que son más flexibles y más susceptibles de variaciones, generalizaciones y modificaciones posteriores.

  2. Esto resulta especialmente práctico en Ross, donde los alumnos se familiarizan con muchas cosas a la vez, por ejemplo, las leyes básicas del razonamiento al mismo tiempo que la noción abstracta de anillo. Para ellos, los números naturales $\mathbb N$ desempeñan un doble papel: como dominio primitivo para realizar la inducción y como primer ejemplo de la noción general de semirings conmutativos. Así pues, el uso de LNP identifica perfectamente $\mathbb N$ como "el único sembrado conmutativo que está bien ordenado", mientras que WI identifica $\mathbb N$ más torpemente como "un sembrado conmutativo con un papel lógico separado".

  3. La PNL fomenta el razonamiento de segundo orden y la representación geométrica de subconjuntos, lo que no ocurre con la WI.

Ventajas e inconvenientes de la inducción transfinita frente al lema de Zorn

Para la inducción transfinita y el lema de Zorn, quizá el zapato esté en el otro pie. Después de todo, rara vez se piensa en los ordinales como un caso especial de una clase más general de objetos matemáticos. Quizá sea más honesto considerar a los ordinales lógicamente privilegiados. Quizá la imagen de construir algo paso a paso sea más útil que la imagen de teletransportarse al elemento maximal.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X