He aquí un enfoque algo menos ad hoc para derivar la fórmula.
Se mira el polinomio $ax^2+bx+c$ y se piensa que está compuesto por dos tipos de indeterminados: los coeficientes $a$ , $b$ , $c$ y variable $x$ . Lo que desea es que si $ax^2+bx+c=a(x-r_1)(x-r_2)$ quieres encontrar una expresión para $r_1$ y $r_2$ en términos de $a,b,c$ que implica únicamente las operaciones $+,-,\times,\div$ y $\sqrt[n]{}$ .
Pero, ¿cómo son $r_1$ y $r_2$ relacionado con $a,b$ y $c$ ? Si se observa la expresión $ax^2+bx+c=a(x-r_1)(x-r_2)$ es fácil calcular que $b=-a(r_1+r_2)$ y $c=ar_1r_2$ .
Intuitivamente porque sabes que $(r_1+r_2)=-\frac ba$ , determinando $r_1$ y $r_2$ es lo mismo que determinar $(r_1-r_2)$ . Sea $E=(r_1-r_2)$ y observe que $2r_1=(r_1+r_2)+(r_1-r_2)=-\frac ba+E=$ y $2r_2=(r_1+r_2)-(r_1-r_2)=-\frac ba-E$ , por lo que ya tenemos la mayor parte de nuestra fórmula cuadrática: $$r_1,r_2=\frac{-b}{2a}\pm\frac{E}2$$
Todo lo que tenemos que hacer entonces, es expresar $E=(r_1-r_2)$ utilizando $+,-,\times,\div,\sqrt[n]{}$ en términos de $a,b,c$ . Para ello, tenemos que dar un pequeño rodeo para ver qué expresiones en $+,-,\times,\div$ y $a,b,c$ podría ser.
Obsérvese que los coeficientes $b=-a(r_1+r_2)$ y $c=r_1r_2$ son funciones simétricas en $r_1$ y $r_2$ en el sentido de que si se intercambia $r_1$ con $r_2$ entre sí, los valores de $b$ y $c$ no cambian. Además, $b$ y $c$ son en realidad múltiplos escalares de los llamados funciones simétricas elementales que tienen la propiedad de que cualquier función simétrica (en $2$ variables) puede expresarse de forma única como un polinomio (cociente de polinomios para nuestros propósitos) en ellas.
En particular, podemos "simetrizar" la cantidad $E=(r_1-r_2)$ para obtener el discriminante $D=(r_1-r_2)^2$ que es en cierto sentido "la más pequeña" función simétrica de $r_1$ y $r_2$ que se convierte en 0 si $r_1=r_2$ . Sin embargo, técnicamente, lo anterior es el discriminante sólo cuando $a=1$ porque nuestros coeficientes $b$ y $c$ son funciones simétricas elementales escaladas por $a$ por lo que definimos el discriminante general como $D=a^2(r_1-r_2)^2$ . Porque $D$ es simétrico y $b$ y $c$ son (hasta un factor multiplicativo) simétricos elementales, deberíamos poder expresar $D$ como un polinomio en $b$ y $c$ .
Lo hacemos de forma un tanto ad hoc (aunque hay algoritmos que lo hacen de forma procedimental): $$D=a^2(r_1-r_2)^2$$ así que $$D=a^2(r_1^2-2r_1r_2+r_2^2)$$ por lo que $$D=a^2(r_1^2+2r_1r_2+r_2^2-4r_1r_2)$$ y finalmente $$D=a^2(r_1+r_2)^2-a^24r_1r_2$$ dándonos $$D=b^2-4ac$$
Evidentemente, ahora tenemos que $\sqrt{D}=a(r_1-r_2)=aE$ y así $E=\frac{\sqrt{D}}a$ . Esto nos permite reescribir nuestra fórmula hasta ahora para llegar a $$r_1,r_2=\frac{-b}{2a}\pm\frac{E}{2}$$ a $$r_1,r_2=\frac{-b}{2a}\pm\frac{\sqrt{D}}{2a}$$ y finalmente $$r_1,r_2=\frac{-b\pm\sqrt{b^2-4ac}}{2a}$$
La única pregunta extraña es: ¿por qué sólo tuvimos que sacar una raíz cuadrada para obtener la fórmula, es decir, por qué la cantidad $E=(r_1-r_2)$ resulta ser una raíz cuadrada de un bonito polinomio en $a,b,c$ ? Ahí es donde los modernos Teoría de Galois entra.
Lo que realmente ocurre es lo siguiente: los cuatro primeros sugieren que se piense en los coeficientes como si vivieran en el campo $F$ (un conjunto de expresiones tal que la suma, la resta, la multiplicación o la división de dos de ellas cualesquiera da otra expresión del conjunto) que consiste en $\{\dfrac {p(a,b,c)}{q(a,b,c)}\}$ donde $p$ y $q$ son polinomios en tres variables (y coeficientes racionales). Entonces $r_1$ y $r_2$ generará un campo de extensión $E$ de $F$ es decir, el campo más pequeño $E$ que contiene $F$ y también $r_1$ y $r_2$ . La teoría de Galois dice que este campo de extensión $E$ será un $2!=2$ -espacio vectorial de dimensiones sobre $F$ y por lo tanto una sola raíz cuadrada será suficiente para generar $E$ . Así pues, necesitamos una expresión en los coeficientes (expresión simétrica en las raíces) cuya raíz cuadrada sea una expresión en las raíces, pero no simétrica, y una elección natural es entonces la función antisimétrica más elemental conocida como la Determinante de Vandermonde que es precisamente $(r_1-r_2)$ en este caso (antisimétrico=intercambiar dos variables invierte el signo, obviamente el cuadrado de una función antisimétrica es una función simétrica).
En el caso de los polinomios generales, el campo de extensión será de mayor dimensión, por lo que habrá que tomar posiblemente varias raíces de distinto orden. La teoría de Galois nos permite calcular cuáles deben ser estas raíces y en qué orden (lo que nos da las fórmulas cúbicas y cuádricas de una manera nada ad-hoc), y también muestra que el grado general $5$ y el polinomio anterior no tiene una fórmula que implique sólo $+,-,\times,\div,\sqrt[n]{}$ . (Algunas personas se asustan por esto, porque al tomar las raíces se debería invertir el aumento de las potencias, pero no es así porque el orden de las operaciones importa...) Ahora bien, si los coeficientes del polinomio de grado superior satisfacen algunas relaciones adicionales (es decir, no son completamente independientes entre sí), entonces la teoría de Galois también da procedimientos para calcular fórmulas para esos casos y también para determinar cuáles deben ser esas relaciones.
14 votos
Mira Wikipedia .
115 votos
Esto es falso. No se puede utilizar la fórmula cuadrática para resolver ecuaciones cuadráticas en campos de característica 2. Pero tal vez no sepas todavía lo que significa eso.
32 votos
@KCd: Por no hablar de la existencia de una raíz cuadrada.
21 votos
KCd y thei mencionan algunas condiciones importantes que se vuelven cruciales en la teoría general. La fórmula requiere que se pueda dividir por 2 y por $a$ y sacar una raíz cuadrada. Así que $b^2-4ac$ , también llamado el Discriminante, tiene que ser un cuadrado. "Si no puedes sacar la raíz cuadrada del discriminante, hay formas algebraicas de sumar la raíz cuadrada para poder resolver la ecuación. Del mismo modo, si no puedes dividir por $a$ a veces hay formas de extenderse a una situación en la que se puede. Ahí es donde empieza el álgebra más avanzada.
3 votos
... Analizar cuándo estas cosas son posibles conduce a importantes conocimientos de gran significado matemático.
3 votos
@KCd: Puede que no sepa lo suficiente de matemáticas como para entender los números complejos, en cuyo caso no puede utilizar siempre la fórmula cuadrática.
3 votos
@Mark Bennet. ¿Por qué no puedo dividir por 2?
6 votos
@Lous Rhys. GF(2) es un campo que sólo contiene los elementos 0 y 1 con las sumas y multiplicaciones habituales. Puedes comprobar tú mismo que cumple todos los axiomas de un campo. Ahora, intenta dividir 1 entre 2.
32 votos
@idonno ¡Admiro tu curiosidad! ¡Ojalá los estudiantes de precalc fueran más curiosos!
9 votos
¿Por qué podemos utilizar -b/a para resolver TODAS las ecuaciones lineales de la forma ax+b = 0?
1 votos
Porque se deriva de la forma general $ax^2 + bx + c =0$ . ¿Tal vez intentar sustituir esto en la ecuación?