Versión tl;dr: Una solución $a^\ell + b^\ell = c^\ell$ generaría una curva elíptica rara (es decir, no modular) sobre $\mathbb{Q}$ para la primera $\ell \geq 5$ . Wiles demostró que no existen curvas elípticas suficientemente raras, lo que significa que el Último Teorema de Fermat se cumple para $\ell \geq 5$ .
No hay una respuesta fácil o concisa a la pregunta, sencillamente porque la teoría de los números en cuestión es muy complicada. Antes de Wiles se sabía que la conjetura Taniyama-Shimura implicaba el último teorema de Fermat, y Wiles lo demostró para una clase de curvas lo suficientemente grande como para demostrar también ese teorema. (La conjetura es un resultado mucho más profundo que el Último Teorema de Fermat, y la prueba de Wiles se extendió también al caso general un poco más tarde).
La idea detrás de la conjetura es que para una curva elíptica $E/\mathbb{Q}$ , se puede reducir el mod $p$ para cada primo $p$ y contar el número de puntos en $E$ en $\mathbb{F}_p$ . Explícitamente, dada una forma de Weierstass $E:y^2 = x^3 + a x + b$ , sólo puedes contar el número de puntos $(x, y)\pmod{p}$ con $y^2 \equiv x^3 + ax + b\pmod{p}$ . Estos pueden ser arrojados en algo como un producto de Euler o una serie de Dirichlet para llegar a un objeto resultante llamado $L$ -serie. (Más o menos, al menos. Hay correcciones que hay que hacer para un número finito de primos $p$ ). Si la conjetura de Taniyama-Shimura se cumple, entonces podemos hacer un poco de manipulación para obtener una función no nula $f$ que es extraordinariamente simétrica bajo el grupo \begin{align*} \Gamma_0(N) = \left\{\begin{pmatrix} a & b \\ c & d\end{pmatrix} \en SL_2(mathbb{Z}):\N-, cequiv 0!\N-!pmod{N}\N-right\} \fin actuando en $\{z\in \mathbb{C}:\, \operatorname{Im} z > 0\}$ por $\begin{pmatrix} a & b \\ c & d\end{pmatrix}.z = (az + b)/(cz + d)$ , donde $N$ es un cierto número entero unido a $E$ . (En concreto, $f$ es una forma modular, por lo que la conjetura de Taniyama-Shimura también se denomina teorema de la modularidad. Además, lo que yo llamo $N$ aquí no es del todo el director de $E$ pero lo divide).
Esta condición sobre la acción $\Gamma_0(N)$ es bastante estricta, y no hay muchos $f$ . En particular, para $N = 2$ no hay ninguna función no nula $f$ en absoluto. Pero resulta que dado coprimo (y no nulo) $a, b, c$ con $a^\ell + b^\ell = c^\ell$ para la primera $\ell \geq 5$ la curva $E:y^2 = x(x - a^\ell)(x - c^\ell)$ resulta que tiene $N = 2$ . Esa contradicción implica que no hay tal $a, b, c$ existen; es decir, el último teorema de Fermat se cumple para $\ell$ . Entonces está claro que el Último Teorema de Fermat se cumple para cualquier exponente $n$ divisible por algún primo $\ell \not = 2, 3$ . Pero los casos $n = 3, 4$ son clásicas, por lo que el teorema se cumple para todas las $n > 2$ .
Entonces, ¿qué pasa con $\ell = 2$ ? Bueno, el teorema obviamente falla: Hay muchos puntos con $a^2 + b^2 = c^2$ y vamos a tener que obtener un valor diferente de $N$ para $\ell = 2$ para que Taniyama-Shimura siga aguantando. No hay una manera fácil de describir esta parte de la prueba, pero la idea básica es calcular el conductor de una determinada curva elíptica, y hay un par de casos que describen su comportamiento cuando se reduce mod $2$ . Si $\ell \geq 5$ podemos eliminar todos los casos, excepto algunos fáciles, y obtener un valor explícito para $N$ . Probablemente no sea especialmente útil, pero véase la advertencia anterior de que no hay una respuesta fácil o concisa a esta pregunta. El principal requisito de la prueba es que $\ell$ sea lo suficientemente grande; el hecho de que $\ell \geq 5$ funciona es una feliz coincidencia.
Si buscas una razón más profunda por la que $\ell = 2$ falla, entonces la razón es que las curvas de Fermat $C:X^\ell + Y^\ell - Z^\ell$ son muy diferentes para $\ell = 2$ que para (prime) $\ell > 2$ . El género de $C$ es $g = \frac{1}{2}(\ell - 1)(\ell - 2) $ que es mayor que $1$ para $\ell > 3$ . El Teorema de Falting establece que tales curvas con $g > 1$ sólo tienen un número finito de puntos en los que se pueden tomar las coordenadas como racionales. (El caso $\ell = 3$ es diferente, pero se maneja fácilmente de forma clásica). Para $\ell = 2$ Pero, evidentemente, no es así; hay infinitos triples pitagóricos. Ahora bien, "finitamente muchos" está desgraciadamente muy lejos de "cero", pero esa es la razón fundamental por la que $\ell = 2$ es diferente. La razón por la que La prueba de Wiles falla es que la curva de Frey $E:y^2 = x(x - a^\ell)(x - c^\ell)$ le da un valor diferente de $N$ cuando $\ell = 2$ y necesitamos $N = 2$ para conseguir una violación de Taniyama-Shimura. En cuanto a por qué ese valor es diferente... bueno, es una función de $\ell$ y resulta que es diferente para $\ell = 2$ frente a $\ell \geq 5$ . No estoy seguro de que haya algo realmente profundo ahí.
Estoy omitiendo y simplificando muchos de los detalles aquí, pero hay un tratamiento más completo pero legible en, por ejemplo, el último capítulo de "Elliptic Curves" de Knapp.