He añadido una sección en la parte inferior de mi respuesta en un enfoque más general que muestra cómo se pueden tratar las funciones que se pueden aplicar a sí mismos dentro de la teoría de conjuntos, los representa como algo distinto de conjuntos de pares ordenados.
En primer lugar, a pesar del nombre, un $\lambda$-la función no es una función en el sentido matemático. Es una cadena (o algún equivalente objeto matemático) que representa un algoritmo — en otras palabras, es un programa de ordenador. (Esto es similar en el sentido en que la palabra "función" se utiliza en los lenguajes de computador, que es diferente de la habitual matemáticos de uso.)
Funciones matemáticas son extensional; en otras palabras, si $f$ $g$ tienen los mismos valores en todos sus argumentos, a continuación, $f=g.$ Esta es la razón por funciones pueden ser consideradas como conjuntos de pares ordenados. Sólo el argumento de pares de valores de la materia, no de cómo se calculan o se determinen.
Los programas de ordenador, en contraste, son intensional. Dos diferentes programas que calculan los mismos valores en todos sus argumentos siguen siendo diferentes programas. De hecho no tenemos ninguna manera de incluso de determinar (a través de algoritmos) si dos programas de ordenador calcular la misma función.
Un nombre mejor que el de "$\lambda$-función" es "$\lambda$-expresión", porque estas cosas son las expresiones o las cadenas de un idioma, no funciones reales ellos mismos.
Formalmente, si usted tiene un alfabeto $A$ e si $S$ es el conjunto de cadenas sobre el alfabeto, $\lambda$- expresión de $e$ es un miembro de $S$ la satisfacción de ciertos requisitos sintácticos. No es una función, pero sí describe un algoritmo que calcula una función determinada $\phi_e\colon D_e\to S$ algunas $D_e \subseteq S$ (el dominio $D_e$ no puede ser todos los de $S$ debido a que el programa informático que $e$ describe no puede detener en todas las posibles cadenas de entrada). Desde $e\in S,$, se puede calcular el $\phi_e(e)$ tal como se puede calcular el $\phi_e(x)$ cualquier $x\in S$ (por supuesto, cualquier cálculo puede o no se puede detener, así que es posible que $\phi_e(x)$ no tiene un valor).
Ahora $\phi_e$ es algo normal en función matemática; se puede considerar como un conjunto de pares ordenados. Desde ese punto de vista, $\phi_e \subseteq S\times S.$ Aviso que $e$ es miembro de sólo $S.$ Usted puede tener $e_1\ne e_2$ (diferentes programas), sino $\phi_{e_1}=\phi_{e_2}$ (de los diferentes programas suceder siempre calcular el mismo resultado si la misma entrada).
Así que nunca aplicar una función a sí mismo. Podemos aplicar una función a una cadena, y también nos sucede a utilizar las cadenas como los programas de ordenador que pueden ser utilizados para calcular funciones.
Por cierto, usted también puede definir la aplicación de la función de $\alpha$ asignación de algún subconjunto de $S\times S$ $S$mediante el establecimiento $\alpha(x,y)=\phi_x(y);$ el par ordenado $\langle x,y \rangle$ pertenece al dominio de la $\alpha$ fib de la cadena de $x$ $\lambda$- expresión y el cálculo de $\phi_x(y)$ se detiene.
Y no hay ningún problema de codificación de todo esto dentro de ZF.
Hay un enfoque algo diferente a todo esto, que es más general. Vamos a ver la pregunta como preguntando: ¿Cómo pueden las funciones que se pueden aplicar a sí mismos ser manejados, a la luz del hecho de que una función en la teoría de conjuntos no es nunca un miembro de su propio dominio?
Para evitar confusiones, voy a llamar a estas hipotéticas nuevas funciones *funciones sólo para distinguirlas de las funciones reales de la teoría de conjuntos.
Para ello, debemos comenzar con un conjunto $F$ (que está destinado a servir eventualmente como el dominio de estas *-funciones y el conjunto de todos *-funciones), un subconjunto $D$ $F\times F,$ y una función de $\alpha\colon D\to F.$ tenga en cuenta que estas están definidas en la teoría de conjuntos; en particular, $\alpha$ es una función, no un *la función. La función de $\alpha$ es destinado a representar la aplicación de un *la función de un argumento.
Así que ahora vamos a definir una *la función de ser un miembro de $F.$ Si $f$ $g$ *- funciones, definiremos $f(g) = \alpha(f, g)$ si $\langle f,g \rangle \in D;$ si $\langle f,g \rangle \not\in D,$ $f(g)$ es indefinido. Básicamente, esto significa que se puede usar cada *la función como una parcial "función" de $F$ $F,$es decir, una "función" de algún subconjunto de $F$ $F.$(he puesto "función" en citas aquí, ya que estos no son conjuntos de pares ordenados, como funciones son generalmente definida, pero que puede ser utilizada como funciones debido a que tenemos una definición de lo $f(x)$ significa que para cualquier $f$ $x$ $F$ . Por otro lado, para cada una de las $f\in F,$ la función de $x \mapsto \alpha(f,x)$ es sólo una normal función matemática; que podríamos llamar, decir, $\varphi_f,$ y tratarlo como un conjunto de pares ordenados, como de costumbre. Incluso podríamos haber comenzado con la función de $f\mapsto \varphi_f$ en lugar de $\alpha.$, Pero aviso de que, en línea con la extensionality/intensionality distinción en la primera parte de esta respuesta, es posible tener $\varphi_f=\varphi_g$, incluso cuando se $f\ne g.)$
Por cierto, si quieres evitar tener parcial "funciones"," sólo distinguir un elemento en $F,$, lo que voy a llamar a $\uparrow.$ $\alpha$ total de la función ahora, con dominio de todos los de $F\times F.$ Si $\alpha(x,y)$ fueron indefinidos, el conjunto es igual a $\uparrow$ ahora. También se establece $\alpha(x,\uparrow)=\alpha(\uparrow,x)=\,\uparrow$ todos los $x\in F.$ Pero creo que el enfoque con parciales de "funciones" es más clara, ya que representa mejor la situación.
Lo que realmente subyace en todo este enfoque es que la definición de la función como un conjunto de pares ordenados no es sacrosanta; es sólo conveniente de codificación que se ha adoptado para representar funciones como conjuntos. Algunos otros códigos estaría bien también (como los números reales pueden ser representados como secuencias de Cauchy o de Dedekind cortes o algo más, mientras que ellos tienen el derecho propiedades). La clave para las funciones es que necesitamos tener una forma de aplicar una función de un argumento.