110 votos

¿Teorías de conjuntos sin teoremas "basura"?

Está claro que primero tengo que definir formalmente lo que entiendo por teorema "basura". En el habitual construcción de números naturales en la teoría de conjuntos un efecto secundario de esa construcción es que obtenemos tal teoremas como $2\in 3$ , $4\subset 33$ , $5 \cap 17 = 5$ et $1\in (1,3)$ pero $3\notin (1,3)$ (como pares ordenados, en la presentación habitual).

Formalmente: Dada una teoría axiomática T, y un modelo de la teoría M en teoría de conjuntos, una sentencia verdadera $S$ en el lenguaje de la teoría de conjuntos es un teorema de la basura si no expresa una sentencia verdadera en T.

¿Sería correcto decir que teoría estructural de conjuntos es un intento de deshacerse de esos teoremas basura?

EDIT: como se ha señalado $5 \cap 17 = 5$ podría interpretarse correctamente en la teoría de entramados como que no es un teorema basura. El problema que tengo es que (desde la perspectiva de las ciencias de la computación) esto no es modular: uno está confundiendo la implementación concreta (en términos de conjuntos) con la firma abstracta de la TAD (de celosías). Por lo demás, las matemáticas son muy modulares (eso es lo que captan muy bien los Functores, por ejemplo), ¿por qué no la teoría de conjuntos también?

177voto

Andreas Blass Puntos 45666

Pido disculpas por publicar como respuesta lo que en realidad debería ser un comentario, relacionado con uno de los comentarios de Jacques Carette sobre mi respuesta anterior. Lamentablemente, esto es demasiado largo para un comentario. Jacques preguntó por qué nos molestamos en los fundamentos de la teoría de conjuntos. Resulta que escribí mi opinión al respecto hace unos 15 años (en un correo electrónico privado) y repetí parte de ella en la lista de correo electrónico fom (= fundamentos de las matemáticas). He aquí una versión ligeramente editada de la misma:

Los matemáticos generalmente razonan en una teoría T que (hasta variaciones menores entre los matemáticos individuales) puede ser describir como sigue. Se trata de una teoría de primer orden con muchas clasificaciones. Las clasificaciones incluyen números (naturales, reales, complejos), conjuntos, pares ordenados y otras tuplas, funciones, colectores, espacios proyectivos, espacios de Hilbert, y y otros. Hay axiomas que afirman las propiedades básicas de éstos y las relaciones entre ellos. Por ejemplo, hay axiomas que dicen que los números reales forman un campo ordenado completo, que cualquier fórmula determina el conjunto de aquellos reales que la satisfacen (y de forma similar con otras clases en reales), que dos tuplas son iguales si tienen la misma longitud longitud y componentes iguales en todas las posiciones, etc.

No hay axiomas que intenten reducir una clase a otra. En particular, nada dice, por ejemplo, que los números naturales o los números reales sean conjuntos de cualquier tipo. (Diferentes matemáticos pueden discrepar sobre si, por ejemplo, los números reales reales son un subconjunto de los complejos o si son una clase separada separado con una incrustación canónica en los números complejos. Estas cuestiones no no afectan a la idea general que estoy tratando de explicar). Así que los matemáticos no suelen decir que los reales son cortes Dedekind (o cualquier otro tipo de conjuntos), a no ser que estén impartiendo un curso de fundamentos y se sientan obligados (¿por fuerzas externas?) a decir tales cosas.

Esta teoría T, por grande y difícil de manejar que sea, puede ser interpretada en teorías de aspecto mucho más simple. ZFC, con su ordenación única y su predicado primitivo, es el principal ejemplo de una teoría más simple. (He dejado he dejado las categorías grandes fuera de T para que esto sea literalmente cierto, pero Feferman ha mostrado cómo interpretar la mayor parte de la teoría de las categorías, incluyendo categorías grandes, en una extensión conservadora de ZFC).

La simplicidad y eficiencia de ZFC y el hecho de que T puede ser interpretado en él (es decir, que todos los conceptos de T tienen definiciones teóricas de conjuntos que hacen que todos los axiomas de T sean demostrables teóricamente) tienen, por lo que veo, dos usos principales. Uno es filosófico: uno no es necesario entender la naturaleza de todas estas entidades abstractas diferentes entidades abstractas; si uno entiende los conjuntos (filosóficamente) puede explicar todo lo demás. El otro es en las pruebas de consistencia e independencia. Demostrar que un problema, por ejemplo de topología, no puede resolverse con las matemática actual significa mostrar que es independiente de T. Así que querrías construir muchos modelos de T para obtener muchos resultados de independencia. Pero los modelos de T son objetos terriblemente complicados. Así que en su lugar construimos modelos de ZFC, que no son tan malos, y confiamos en la interpretación para convertirlos en modelos de T. Y normalmente no mencionamos T en absoluto y identificamos ZFC con las "matemáticas actuales" a través de la interpretación.

66voto

Lo que describes es la idea de "romper" una abstracción. Que haya que romper una abstracción es algo intrínseco a la propia noción de "teoría de modelos", en la que interpretamos los conceptos de una teoría en términos de objetos y operaciones de otra (normalmente la teoría de conjuntos).

Puede ayudar ver una analogía de programación de lo que estás haciendo:

uint32_t x = 0x12345678;
unsigned char *ptr = (unsigned char *) &x;
assert( ptr[0] == 0x12 || ptr[0] == 0x78 );  // Junk!

const char text[] = "This is a string of text.";
assert( text[0] == 84 );  // Junk!

// Using the GMP library.
mpz_t big_number;
mpz_init_ui(big_number, 1234);
assert(big_number[0]._mp_d[0] == 1234); // Junk!

Todos estos son ejemplos de lo mismo de lo que te quejas en el ámbito matemático: cuando se te presenta una especie de "tipo", y operaciones para trabajar con ese tipo, pero en realidad se implementa en términos de algunas otras nociones subyacentes. En lo anterior:

  • He roto la abstracción de un uint32_t que representa un número módulo $2^{32}$ , al espiar su representación en bytes y extraer un byte.

  • He roto la abstracción de que una cadena está hecha de caracteres, utilizando el conocimiento de que el carácter 'T' y el valor ASCII 84 son la misma cosa

  • En la tercera, he roto la abstracción de que big_number es un objeto de tipo entero, y se asomó a las interioridades de cómo la biblioteca GMP almacena tales cosas.

Para evitar la "basura", creo que tendrás que hacer una de estas dos cosas:

  • Abandonar la noción de modelo totalmente
  • Date cuenta de que en realidad estabas mintiendo en tus teoremas: no es que $2 \in 3$ para los números naturales $2$ et $3$ pero $i(2) \in i(3)$ para una interpretación particular $i$ de la aritmética de Peano. ¿Quizás hacer explícita la interpretación te permitiría estar más cómodo?

(O, dependiendo de lo que se quiera decir exactamente con la notación, los símbolos $2$ et $3$ no están expresando constantes en la teoría de los números naturales, sino que están expresando constantes en la teoría de conjuntos).

49voto

Andreas Blass Puntos 45666

La teoría estructural de conjuntos, tal y como se describe en la página de nlab que has enlazado, es probablemente la mejor respuesta a tu pregunta. Para evitar teoremas basura, hay que desviarse un poco de la teoría de conjuntos ordinaria al estilo de ZF, donde todo es un conjunto. Eso es porque, una vez que decides, en el contexto de una teoría de conjuntos "material", que 5 y 17 deben ser conjuntos (porque no hay nada más que puedan ser), tienen que tener una unión, y no hay ninguna opción intuitivamente razonable para ello. (He dicho "unión" en lugar de "intersección" porque uno podría considerar el conjunto vacío como una intersección razonable; pero la unión no puede ser vacía a menos que ambos conjuntos lo sean). Una presentación muy elemental (de pregrado) de algunas matemáticas desde este punto de vista está en el libro "Sets for Mathematics" de Lawvere y Rosebrugh; una presentación más avanzada es (si no recuerdo mal) "Practical Foundations of Mathematics" de Paul Taylor.

16voto

ricree Puntos 5055

Muchas de estas respuestas son bastante satisfactorias, pero me gustaría destacar que gran parte de la confusión puede venir de la sobrecarga de símbolos como " $\in$ ", " $\subset$ ", " $\cap$ ", y " $2$ ", es decir, esos símbolos tienen múltiples significados que dependen del contexto. En particular, los teoremas basura que proporcionas son situaciones en las que se ha malinterpretado algún tipo de sobrecarga; de hecho, la validez de los teoremas puede cambiar si se pasa a considerar los números naturales como números complejos.

La sobrecarga de símbolos es útil, porque muchas estructuras algebraicas y geométricas como los anillos y los colectores admiten una noción de "conjunto subyacente", pero debemos tener cuidado de no confundir el $\subset$ adjunta a los colectores tal y como los utilizamos con el $\subset$ adjunta a una codificación teórica de conjuntos pura elegida de las variedades. Por ejemplo, es probable que la intersección de submanifolds parezca bastante complicada una vez que elijamos un método para desdoblar dicha operación en una fórmula teórica de conjuntos pura.

Otra forma de ver los teoremas basura es decir que son afirmaciones que dependen de una elección no canónica de la codificación de los objetos matemáticos como conjuntos puros. Esto no debe interpretarse como una afirmación de que conozco una forma de resolver los fundamentos ligados a nociones como "elección no canónica de la codificación".

13voto

Matthew Scouten Puntos 2518

Aunque es un poco farragoso, hay un método para formalizar las cosas que evita estos teoremas. Sin duda, teoremas como $ \{ \{ \} , \{ \{ \} \} \} \in \{ \{ \} , \{ \{ \} , \{ \{ \} \} \} \} $ permanecen, pero eso no es basura; sin embargo, $ 2 \in 3 $ (o incluso $ 2 _ \mathbb N \in 3 _ \mathbb N $ ) no estará allí.

Definir un sistema de números naturales para ser un par ordenado $ ( N , \sigma ) $ tal que $ \sigma $ es un par ordenado $ ( z , s ) $ tal que $ z $ es un elemento de $ N $ , $ s $ es una función de $ N $ a $ N $ , $ z $ no está en el rango de $ s $ , $ s $ es inyectiva, y el único subconjunto $ A $ de $ N $ tal que $ z \in A $ et $ s [ A ] \subseteq A $ es $ N $ sí mismo. Dado un sistema de números naturales $ \mathbb N = ( N , ( z , s ) ) $ , dejemos que $ 0 _ \mathbb N $ sea $ z $ , dejemos que $ 1 _ \mathbb N $ sea $ s ( z ) $ etc.; del mismo modo, se puede definir $ + _ \mathbb N $ , $ \times _ \mathbb N $ etc. Ahora puede demostrar teoremas sobre los números naturales; tales teoremas tienen la forma 'Para cada sistema de números naturales $ \mathbb N $ , [ ].', al igual que los teoremas sobre grupos tienen la forma 'Para cada grupo $ G $ , [ ].'.

Por supuesto, la teoría de los números se diferencia de la teoría de los grupos en un aspecto importante, y es que todos los sistemas de números naturales son isomorfos (de hecho, únicamente isomorfos). Ciertamente, vale la pena demostrarlo (después de definir qué es un isomorfismo de este tipo para poder enunciarlo), pero no es necesario demostrarlo (ni siquiera enunciarlo) para empezar a enunciar y demostrar teoremas sobre los números primos o lo que sea. Es posible que al menos quieras demostrar que existe un sistema de números naturales (que es el único lugar en todo esto que requiere el axioma del infinito), aunque ni siquiera tienes que hacer eso para demostrar teoremas sobre los números primos; en cualquier caso, el sistema cuya existencia decidas demostrar no juega ningún papel especial en el resto de la teoría.

En algo como ETCS, por supuesto, siempre se hace algo así para construir números naturales, por lo que ETCS parece tener menos teoremas basura. Pero entonces, cuando se construye $ \mathbb R $ de $ \mathbb N $ Los teoremas de la basura aparecen en ambos sistemas formales, a no ser que se pase por el mismo trámite para definir un sistema de números reales, etc. Pero eso se puede hacer.

ETA: Si puedo citar una autoridad, este enfoque es más o menos el adoptado por Walter Rudin en Principles of Mathematical Analysis (bebé Rudin) para $ \mathbb R $ . En el capítulo 1, Rudin define un campo completo ordenado, define un isomorfismo entre tales, demuestra que dos tales son unívocamente isomorfos, y dice que ahora usaremos cualquiera de ellos y no nos preocuparemos de cuál es. Así, el resto del libro viene precedido esencialmente por "Si $ \mathbb R $ es un campo ordenado completo". (En un apéndice del capítulo, demuestra que existe uno, pero no hace más referencia a esa construcción).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X