54 votos

¿Cuándo entra el conjunto en la teoría de conjuntos?

Me pregunto sobre los fundamentos de la teoría de conjuntos y mi pregunta puede plantearse de algunas formas relacionadas:

  • Si basamos la teoría de conjuntos de Zermelo-Fraenkel en la lógica de primer orden, ¿significa eso que la lógica de primer orden no puede contener la noción de conjunto?

  • Los axiomas de la teoría de conjuntos de Zermelo-Fraenkel parecen esperar ya que se defina la noción de conjunto. ¿Existe una definición previa de lo que estamos tratando? ¿Y dónde?

  • En teoría de conjuntos, si un función se define como un conjunto que utiliza tuplas, ¿por qué o cómo la lógica de primer orden y los axiomas de la teoría de conjuntos de Zermelo-Fraenkel contienen propiedades dependientes de los parámetros? $\psi(u_1,u_2,q,...)$ ¿qué son básicamente funciones?

3 votos

No entiendo tu segunda versión: los axiomas de ZF son en efecto una definición de la noción formal de configure . Por supuesto, pretenden captar la noción informal e intuitiva preexistente.

2 votos

Hace muchos años me planteé esta misma pregunta. Para estudiar lógica y teoría de conjuntos, basta con tener una definición intuitiva de los conjuntos, las funciones y los números naturales. groups.google.com/group/sci.logic/msg/

4 votos

Relacionado Pregunta MO .

37voto

sewo Puntos 58

(1) En realidad, esto no es un problema en la forma en que lo has planteado -- las reglas de lo que es una prueba válida en lógica de primer orden se pueden enunciar sin ninguna referencia a conjuntos, como por ejemplo hablando puramente de operaciones sobre cadenas concretas de símbolos, o por aritmetización con números de Gödel.

Sin embargo, si desea hacer teoría de modelos en tu teoría de primer orden necesitas conjuntos. E incluso si se adopta el punto de vista sintáctico y se dice que todo son simples cadenas, eso sólo hace descender un nivel el problema fundamental, porque ¿cómo podemos entonces formalizar el razonamiento sobre números naturales (o cadenas de símbolos) si la propia lógica de primer orden "depende de" números naturales (o cadenas de símbolos)?

La respuesta a eso es que así es -- la formalización de la lógica de primer orden es no realmente la base última de todas las matemáticas, sino un modelo matemático del propio razonamiento matemático. El modelo no es la cosa, y el razonamiento matemático, en última instancia, no es realmente una teoría formal, sino algo que hacemos porque creer intuitivamente que funciona.

(2) Se trata de un malentendido. En la teoría axiomática de conjuntos, los propios axiomas son la definición de la noción de conjunto: Un conjunto es lo que se comporta como los axiomas dicen que se comportan los conjuntos.

(3) Lo que citas es como suelen ser las funciones modelado en teoría de conjuntos . De nuevo, el modelo no es la cosa, y sólo porque podamos crear un modelo de nuestro concepto abstracto de relación funcional en la teoría de conjuntos, no significa que nuestro concepto abstracto an sich es necesariamente una criatura de la teoría de conjuntos. La lógica tiene su propia forma de modelar las relaciones funcionales, a saber, escribiendo reglas sintácticas sobre cómo deben comportarse -- esto es menos expresivo pero suficiente para las necesidades de la lógica, y es no menos válida como modelo de relaciones funcionales que el modelo teórico de conjuntos.

0 votos

Gracias por la respuesta. (1) Así que te basas en la capacidad de la lógica para sobrevivir por sí misma, al igual que manipulación de cadenas basada en reglas y sin conjuntos en mente. Yo pienso así. El segundo párrafo básicamente abstrae las relaciones y desecha la idea humana de conjunto, ¿no? Por último, si vemos cómo funciona la manipulación de cuerdas, ¿por qué sigue siendo necesario "creer intuitivamente"? (2) En vista de eso, ¿no sería mejor que usáramos otra notación para las relaciones como $\in$ en lógica y teoría de conjuntos. Eso señalaría que sólo utilizamos la forma de manipular estas cosas - no "conjuntos".

0 votos

Y al punto (3): ¿Así que dices que la función teórica de conjuntos sólo se usa después de que se defina allí así, mientras que la lógica usa una versión de la función, que no está necesariamente relacionada con ella? Y en relación con (2): "modelo matemático del razonamiento matemático" suena difícil, porque entonces no sé qué es el 'razonamiento matemático' an sich. Me refiero a si hay razonamiento matemático en absoluto, si existe una noción, tal que podamos modelarlo, es decir, si existe avant existe un modelo de la misma. ¿Y decimos que la teoría de conjuntos ZF es un modelo de lógica, o de conjuntos, o de qué?

1 votos

Tengo que irme; intentaré aclarar los puntos técnicos mañana. Por ahora, sólo esto: Si usted puede "ver cómo la manipulación de la cadena funciona", que es la creencia intuitiva de la que hablo. Ciertamente I intuitivamente creo que las cadenas de símbolos existen y se pueden concatenar y separar, y que si tomo dos cadenas diferentes y añado la misma cadena a cada una de ellas, los resultados serán diferentes, etc. Pero no puedo justificar esa creencia apelando a ningún concepto que me parezca más básico. Simplemente está ahí. Puedo modelo cadenas utilizando enteros o conjuntos, pero eso es algo diferente.

20voto

joseph.j.stern Puntos 41

Para aquellos preocupados con bases sólidas para las matemáticas, el problema es básicamente el siguiente: En orden a incluso el estado de los axiomas de la teoría de conjuntos ZF, necesitamos han desarrollado la lógica de primer orden; pero en orden a reconocer bajo qué condiciones de primer orden lógico de las fórmulas pueden ser considerados como "verdadero" o "válido", necesitamos dar un modelo de la teoría de la semántica de la lógica de primer orden, y esto a su vez requiere de ciertas nociones de la teoría de conjuntos. A primera vista, esto parece troublingly circular.

Obviamente, esta es una muy sutil de la zona. Pero, como alguien que en ocasiones se ha preocupado por este tipo de preguntas, permítanme ofrecer algunos pensamientos personales, por lo que puede ser vale la pena.

Mi propio punto de vista es algo como esto. Primero vamos a distinguir cuidadosamente entre la lógica y la metalogic.

En la lógica, que consideramos como un pre-disciplina matemática, todo lo que podemos hacer es dar reglas gramaticales para la construcción de la bien formada declaraciones y la derivación de reglas para la construcción de las "pruebas" (o tal vez, para no mendigar a la pregunta, debemos llamar "convincentes demostraciones"); estos deben basarse exclusivamente en las formas gramaticales de las diversas declaraciones de los involucrados. Hay, en este punto, no hay técnica o teoría matemática de cómo asignar significados a estas fórmulas; en lugar de ello, consideramos meramente simbólico abreviaturas para los subyacentes de las expresiones del lenguaje natural, con lo informal psicológica interpretaciones de estos ya se han unido a ellos. Nosotros "justificar" la derivación de reglas de manera informal por persuadir a nosotros mismos a través de ejemplos ilustrativos e informal semántico de los argumentos que se encarnan un facsímil razonable de algunos que ocurren naturalmente, razonando que encontramos en el uso común. Lo que no hacemos, en este nivel, se intenta especificar cualquier semántica formal. Así que todavía no podemos probar o incluso hacer sentido de los resultados clásicos de metalogic tales como la solidez y/o integridad de un determinado sistema de derivación de reglas. Para nosotros, la "solidez" sólo significa que cada derivación de la regla que representa comúnmente aceptado de forma intuitiva y legítimo patrón de lingüística de la inferencia; "integridad" básicamente significa nada. Pensamos en la lógica de primer orden como una mera transcripción en notación simbólica de ciertos relativamente poco polémica aspectos de nuestra pre-razonamiento crítico hábitos. Insistimos en que esta representación simbólica por dos razones: (i) la reglamentación, precisamente porque limita la creatividad expresiva, es una ayuda a la precisión; y (ii) sin una representación simbólica, no habría esperanza de eventualmente la formalización de nada.

Ahora tomamos nuestro primer paso hacia la verdadera formalización mediante el establecimiento de criterios (en lenguaje natural) por lo que debería constituir una expresión formal en el primer lugar. Esta consiste en tomar como primitivas (i) la noción de un token (es decir, un resumen de pie en un "símbolo"), (ii) una relación binaria de la distinción entre símbolos (tokens), (iii) la noción de una cadena, y (iv) una relación ternaria de "comprisal" entre las cuerdas, sujeto a ciertos axiomas. Los axiomas que rigen estos primitivos sería algo como esto. En primer lugar, cada token es una cadena; estas cadenas no están compuestos de cualquier otra cadena. Por definición, las dos cadenas que son ambos símbolos son distintos si los dos testigos son distintos, y cualquier cadena que es un token es distinta a la de cualquier cadena que no es un token. En segundo lugar, para cualquier símbolo t y cualquier cadena S, no hay una única cadena U compone de t y S (podemos denotar este U 'tS'; esto es meramente una notación para la cadena de U, o simplemente "t", es simplemente una notación para el resumen token involucrados --- no debe ser considerado como la propia cadena). Por definición, tS y t' son distintas cadenas si t y t' son distintos tokens o S y S' son distintas cadenas (esto es intuitivamente un legítimo definición recursiva). En tercer lugar, nada es una cadena, salvo en virtud de los dos primeros axiomas. Podemos definir la concatenación de los rayos UV de las cadenas de U y V de forma recursiva: si U es un símbolo t, definir UV como la cadena de televisión; de lo contrario, U debe ser t para algunos token de t y de la cadena S, y definimos a la UV como la cadena de tW, donde W es el (ya definida) de la concatenación de SV. Esta operación puede ser probada asociativa por inducción. Todo esto es parte de intuitivo, más que formal, matemáticas. Simplemente no hay manera de conseguir las matemáticas fuera de la tierra, sin entender que una parte de él es sólo una parte de la lingüística de la actividad rutinariamente tomamos parte como comunicativa de los animales. Dicho esto, vale la pena el esfuerzo de formular las cosas de modo que esta parte se hace tan pequeño como sea posible.

Con ese fin, se puede insistir en que cualquier lenguaje que se utiliza en matemáticas formales (o, al menos, capaces de representación formal). Esto significa que requieren que algunos distinguen símbolo de lado y acordados para cada uno de los distintos token proponemos dar por sentado, y que todo lo afirmado de las fichas en última instancia puede ser formulado en términos de las nociones de la distinción, cadenas, comprisal, y la concatenación se discutió anteriormente. Observe que no hay ningún requisito para que un conjunto finito de símbolos, ni tenemos el recurso dentro de un lenguaje formal a cualquier noción de un conjunto o un número.

Volviendo a nuestro lógica simbólica, podemos ahora demostrar un teorema de intuitivo (informal) de las matemáticas que, con la simbólica de las abreviaturas (las conectivas, cuantificadores, etc.) se asignan a distintas fichas, podemos formular la gramatical y derivativo reglas de la lógica estrictamente en términos de cadenas y la maquinaria asociada de lenguaje formal de la teoría. Esto trae un pie de la lógica simbólica en el ámbito de la educación formal de las matemáticas, que nos da un lenguaje para expresar la evolución ulterior; pero uno de los pies deben permanecer fuera del mundo formal, la conexión de nuestro lenguaje simbólico a las intuiciones que le dieron origen. El punto es que tenemos un excelente, aunque completamente extra-matemáticos, la razón para el uso de este particular lenguaje formal y sus asociados del sistema de deducción: es decir, creemos que es la que capta la mayor precisión posible las nociones intuitivas de corregir el razonamiento que fueron originalmente escrito en taquigrafía. Este es el mejor que se puede esperar que hagan; no debe ser un salto de fe en algún punto.

Con nuestro técnicamente no interpretada simbólico/métodos de representación de vista de la lógica acordado (y no todo el mundo viene a lo largo de incluso a este punto, obviamente, la intuitionists, por ejemplo), podemos proceder a formular los axiomas de ZF teoría de conjuntos de la forma habitual. Esto añade conjuntos y la pertenencia a las primitivas nociones ya se dan por sentadas (tokens, cadenas, etc.). La motivación de las consideraciones para cada nuevo axioma, por ejemplo, el deseo de evitar la paradoja de Russell, tienen sentido dentro de la comprensión intuitiva de la lógica de primer orden, y estas consideraciones son, en cualquier caso, nunca se consideró parte del desarrollo formal de la teoría de conjuntos, en cualquier planteamiento de cuestiones fundamentales.

Una vez que hemos básicos de la teoría de conjuntos, podemos volver atrás y completar nuestro cuadro de formales de razonamiento mediante la definición de modelo de la teoría de la semántica de la lógica de primer orden (o, de hecho, de orden superior, de la lógica) en términos de conjuntos y establecer la teoría de las ideas como la de la inclusión y la n-tuplas. El propósito de esto es doble: en primer lugar, para profundizar nuestra comprensión intuitiva de corregir el razonamiento mediante la incorporación de todos nuestros aislado instintos acerca de patrones válidos de descuento dentro de una estructura rígida, así como para proporcionar una comprobación independiente de los instintos; y en segundo lugar, para permitir el desarrollo de la teoría matemática de la lógica, es decir, metalogic, donde hermosas resultados sobre sistemas de razonamiento en su propio derecho puede ser formulado y probado.

Una vez que tenemos un conocimiento preciso de la semántica (y metatheory) de la lógica de primer orden, podemos volver para el desarrollo de la teoría de conjuntos y compruebe que cualquier deducciones lógicas que hemos utilizado en la demostración de teoremas de hecho hubo realmente válida en el sentido formal (y todos ellos resultan ser, por supuesto). Esto no cuenta como una justificación técnica de uno por medio de los otros, pero sólo muestra que los dos juntos tienen un reconfortante tipo de coherencia. Creo que de su relación como algo análogo a la forma en la que los dos conceptos de "término" y "fórmula" en la lógica de la gramática no puede ser definida independientemente una de la otra, sino que debe ser definido de manera simultánea la recursividad. Que, obviamente, sólo una vaga analogía, pero es una que me parece útil y reconfortante.

Espero que esto tenía sentido y era un poco útil. Mis disculpas por ser tan prolijo. Saludos. - Joseph

0 votos

¿No existe una versión mínima de la teoría de conjuntos que puedas desarrollar por tu cuenta y utilizar después para la semántica de la lógica de primer orden (con la que construirás después tu teoría de conjuntos ZF fuerte)? - También, pero esto no es demasiado relevante para el asunto de la pregunta: No necesito ninguna charla sobre la verdad, o la justificación de las ciertas reglas de la lógica. Tengo un punto de vista bastante formalista, para mí es mover símbolos de un lado a otro

0 votos

@NikolajK: Sé que este es un post muy antiguo, pero acabo de ver tu comentario aquí y puede que te interese math.stackexchange.com/a/1808558/21820 .

11voto

user27515 Puntos 214

Como es debido, la lógica no debería preocuparse por las nociones de conjunto. Podemos utilizar la noción en un sentido casi metafórico, como decir que nuestro lenguaje (de primer orden) consiste en un configure de símbolos, y a partir de estos símbolos definimos el configure de fórmulas. Esto no es realmente un problema, ya que los objetos básicos de la lógica son símbolos que se pueden escribir, y nuestro configure o símbolos puede ser sólo un listado de estos símbolos (o una descripción de cómo escribirlos), y nuestro configure de fórmulas no es más que un método para analizar una expresión escrita y determinar si se trata o no de una fórmula. Como menciona Henning Makholm en su respuesta, cuando se pasa de la lógica a la teoría de modelos la distinción puede volverse más turbia.

En la teoría (axiomática) de conjuntos, consideramos la noción de "conjunto" como un básico o indefinido . Esto se debe principalmente a motivos pragmáticos: no se puede definir todo en términos de conceptos más básicos, y es difícil pensar en un concepto al que se pueda reducir "conjunto". En realidad, esto no difiere de lo que hizo Euclides, que definió un punto para ser "lo que no tiene parte", pero dejó como totalmente indefinido lo que es una parte, o cómo algo podría carecer de una. Lo que sí nos dicen los axiomas de ZF(C) son las propiedades básicas que suponemos que son ciertas sobre los conjuntos, o al menos aquellas propiedades de los conjuntos que parecen ser ciertas después de pensar seriamente en ello. (Esto puede parecer un poco frívolo, pero pensemos en la paradojas/antinomias de finales del siglo XIX y principios del XX. Éstos hicieron que los matemáticos --o teóricos de conjuntos-- consideraran muy detenidamente qué operaciones o principios de construcción de conjuntos no conducirán obviamente a contradicciones, y estas discusiones dieron lugar a muchos de los axiomas que tenemos hoy en día).

En términos de funciones a predicados, tienes razón en que un teórico de conjuntos definirá una relación como un conjunto formado por pares ordenados, donde un par ordenado es un conjunto de la forma $\{ \{ a \} , \{ a , b \} \}$ Pero el teórico de conjuntos no está haciendo ninguna afirmación metafísica/ontológica sobre la verdadera naturaleza de estos conceptos. En su lugar, el teórico de conjuntos está traduciendo estas nociones de la matemática ordinaria al lenguaje de los conjuntos. Esto se hace porque, en la teoría formal, no se puede hablar de objetos que no sean conjuntos. Si no se pudiera hacer esta traducción, no habría posibilidad de utilizar la teoría de conjuntos como fundamento de todas las matemáticas, y la teoría de conjuntos sería un área de estudio bastante anodina. Por supuesto, después de haber establecido esta traducción, debemos demostrar que estos conceptos definidos tienen las mismas propiedades que nuestra concepción "informal" de ellos. Por ejemplo, un teórico de conjuntos demostrará que $\{ \{ a \} , \{ a , b \} \} = \{ \{ c \} , \{ c , d \} \}$ si $a=c$ y $b=d$ . Una vez hecho esto, podemos definir el par ordenado $(a,b)$ el conjunto $\{ \{ a \} , \{ a , b \} \}$ porque nuestra noción intuitiva de un par ordenado es la de algo que puede distinguir la primera coordenada de la segunda.

Esas propiedades "dependientes de parámetros" de las que hablas no son más que fórmulas (posiblemente) con variables libres. La forma en que manejamos esas expresiones sintáctica y semánticamente puede llevar a pensar en ellas como funciones o predicados --y esto es extremadamente útil en la práctica--, pero su "verdadera naturaleza" dista mucho de ser esa.

5voto

user25634 Puntos 18

Los axiomas de ZFC se enuncian en lógica de primer orden. Un enunciado está en lógica de primer orden por su forma, no por su contenido. Los dos términos indefinidos de la teoría de conjuntos son "conjunto" y $\epsilon$ . Las cosas de las que hablamos se llaman "conjuntos", sean lo que sean, y la única relación indefinida es el predicado binario $\epsilon$ sea lo que sea lo que eso signifique. Los axiomas implícitamente determinar cómo interactúan estas nociones. Los axiomas están diseñados para captar nuestras nociones intuitivas de cómo actúan los conjuntos, pero una vez formalizados, ya no tenemos ningún control sobre su significado.

Esto se parece, por ejemplo, a los axiomas de Euclides para la geometría, en los que "línea", "entre", etc. nunca se definen explícitamente.

Una fórmula $\psi(u_1, u_2, q, \ldots)$ con variables "libres" puede ser verdadero o falso en función de sus entradas. Define una relación en general y mayo definir una función. Una función debe tener una "salida" única para cada conjunto de "entradas"; una relación no tiene ese requisito.

1voto

DanV Puntos 281

Henning y Arthur han dado buenas respuestas, pero creo que debo añadir algo sobre tu tercera pregunta.

La razón por la que permitimos parámetros es que queremos un mundo rico de posibles funciones. Obsérvese que, internamente, la colección de conjuntos definibles sólo mediante una fórmula sin parámetros es bastante aburrida. A veces incluso tenemos que utilizar axiomas para demostrar que un conjunto definido de una determinada manera no es vacío.

Consideremos ahora la función que, dada $x$ devuelve una función $f_x\colon x\to P(x)$ definido como $$f_x(a)=\{a\}, \forall a\in x$$

Está bastante claro cómo se define esta función de $x$ pero si $x$ no es un conjunto definible entonces tenemos que permitir parámetros para poder afirmar algo sobre $f_x$ en una frase de primer orden.

En particular si queremos afirmar que dada una función definible con parámetros entonces si su dominio es un conjunto, entonces también lo es su rango (ese es el esquema del axioma de sustitución) debemos permitir parámetros de lo contrario no podemos afirmar que $f_x$ es una función cuyo rango debe sea un conjunto.

Esta es la razón por la que el esquema del axioma de sustitución dice que dada una fórmula, si después de establecer ciertos parámetros la fórmula es ahora funcional, entonces si el dominio se toma como un conjunto, entonces el rango es también un conjunto.

0 votos

No he visto ninguna respuesta de Arthur. ¿Se ha borrado o Arthur ha cambiado de nombre de usuario?

0 votos

User642796 era conocido anteriormente como arjafi, y antes como Arthur Fischer.

0 votos

Gracias por la aclaración

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X