Varias de las otras respuestas han señalado el peligro de confundir un polinomio $p$ con un función polinómica . Cuando se trabaja sobre los números reales esta distinción no es particularmente importante, ya que hay una correspondencia uno a uno entre los dos tipos de objetos, pero sobre anillos arbitrarios (incluso otros campos) la distinción es muy importante. La definición de derivada dada en la OP se aplica a los polinomios, y una forma de parafrasear la pregunta es preguntar bajo qué condiciones se puede aplicar de forma consistente a las funciones polinómicas.
Con esto como marco, aquí hay un par de observaciones que (creo) no han sido hechas por las otras respuestas.
Dejemos que $R$ sea un anillo cualquiera, y que $p \in R[x]$ sea cualquier polinomio con coeficientes en $R$ . Tenga en cuenta que estamos pensando en $p$ aquí como una expresión formal de la forma $a_n x^n + \cdots a_0$ donde cada $a_k \in R$ pero somos no pensando en $p$ como una función en $R$ . Sin embargo, $p$ hace inducen naturalmente una función $R \to R$ y es útil tener una notación para esa función, así que vamos a llamarla $\hat{p}$ . Ahora tenemos dos objetos diferentes, $$p \in R[x]$$ y $$\hat{p} \in R^R$$ donde $R^R$ denota el conjunto de todas las funciones que mapean $R \to R$ . Ambos $R[x]$ y $R^R$ son anillos: en $R[x]$ las operaciones de suma y multiplicación son "formales" (es decir, sólo se utilizan las propiedades distributivas y asociativas para expandir y simplificar una combinación de polinomios) mientras que en $R^R$ las operaciones de suma y multiplicación son "puntuales" (por ejemplo, si $f,g \in R^R$ entonces $f+g$ se define como la función que mapea $r \in R$ a $f(r) + g(r)$ ). Ahora se puede comprobar que la asociación $p \mapsto \hat{p}$ es un homomorfismo de anillo.
Este homomorfismo (que podemos llamar "mapa de interpretación funcional" y denotar por $\Phi$ ) no es, en general, uno a uno. Por ejemplo, si $R=\mathbb{Z}_p$ para algún primo $p$ entonces el núcleo de $\Phi$ es generado por $x^p - x$ . Esto significa que cuando $x^p - x$ se interpreta como una función, "actúa como" la función (constante) cero. Dicho de otro modo, podemos decir que $x^p$ y $x$ son equivalentes como funciones aunque sean distintos como polinomios . Más precisamente, utilizando la notación anterior podemos escribir $\hat{x^p} = \hat{x}$ aunque $x^p \ne x$ .
Este ejemplo también muestra que la regla de la derivada formal en el PO no "funciona" a nivel de funciones, porque la derivada formal de $x^p$ es $p\cdot x^{p-1} = 0$ mientras que la derivada formal de $x$ es $1$ Por tanto, los polinomios que son equivalentes cuando se interpretan como funciones no tienen necesariamente derivadas equivalentes.
(Para la pregunta general "¿Cuándo es $\Phi$ uno a uno", véase https://mathoverflow.net/questions/160986/rings-for-which-no-polynomial-induces-the-zero-function .)
Así que las otras respuestas a esta pregunta, que señalan que la definición de derivada formal se aplica en el contexto de los "polinomios formales" pero no necesariamente en el contexto de las "funciones polinómicas", son acertadas. Sin embargo, resulta que hay una forma alternativa de definir la derivada de un polinomio con coeficientes en un anillo arbitrario que (a) se compromete directamente con (en lugar de evitar) la interpretación de un polinomio como función, y (b) generaliza la conexión entre derivadas y cocientes de diferencia, pero (c) evita la necesidad de utilizar límites. En el contexto familiar en el que $R=\mathbb{R}$ reproduce la teoría estándar de la diferenciación; para el general $R$ Reproduce la definición formal dada en el PO.
Así es como funciona:
Dejemos que $p \in R[x]$ sea un polinomio arbitrario. Elija cualquier elemento $a \in R$ . Entonces podemos dividir formalmente $p$ por $x-a$ y obtener un cociente $q$ y un resto $r$ . (Podemos determinar $q$ y $r$ utilizando el algoritmo de la división larga o el de la división sintética, ambos funcionan bien en anillos arbitrarios). Tenga en cuenta que $q,r \in R[x]$ pero todavía no los interpretamos como funciones. Además, como $r$ debe ser de menor grado que el divisor $x-a$ debe ser una constante, es decir, un elemento de $R$ mismo. (Aquí estoy usando la incrustación natural de $R$ como un subring de $R[x]$ .) Ahora tenemos la relación $$p = (x-a)q + r$$ Donde $p, q \in R[x]$ y $r \in R$ .
Ahora apliquemos el homomorfismo de interpretación funcional $\Phi$ a esta ecuación. Encontramos que para cualquier $b \in R$ , $$\hat{p}(b) = (b-a)\hat{q}(b) + r$$ y en particular $$\hat{p}(a) = r$$ Es el análogo de lo que se llama (en el álgebra de la escuela secundaria) "el teorema del resto". Nos dice que podemos reescribir la relación entre $p$ y $q$ como $$p = (x-a)q + \hat{p}(a)$$ o como $$p - \hat{p}(a) = (x-a)q$$
Interpretando lo anterior como funciones y actuando sobre un $b\in R$ obtenemos
$$\hat{p}(b) - \hat{p}(a) = (b-a)\hat{q}(b)$$
Ahora es muy tentador reescribir la ecuación anterior en la forma $\hat{q}(b)=\frac{\hat{p}(b) - \hat{p}(a)}{b-a}$ . No podemos realmente hacerlo, ya que la división no está definida en $R$ . Si $b-a$ resulta ser un elemento invertible entonces podemos hacerlo, y más generalmente si $R$ es un dominio integral entonces podríamos incrustar $R$ como un subring de su campo de fracciones, pero para un $R$ tenemos que ser más cuidadosos. Sin embargo, la ecuación $\hat{p}(b) - \hat{p}(a) = (b-a)\hat{q}(b)$ sugiere que podemos interpretar $\hat{q}(b)$ como la "pendiente" de la "línea" que une $\left( a, \hat{p}(a) \right)$ y $\left( b, \hat{p}(b) \right)$ .
Si aceptamos esta interpretación como plausible -- y observamos que en el caso de que $R$ es un campo que se reduce a la idea estándar de que "la pendiente es el aumento sobre la carrera" -- entonces es natural identificar $\hat{q}(a)$ como el pendiente de la "línea tangente" a la gráfica de $\hat{q}$ en $a$ .
Si todo esto te parece demasiado abstracto y formal, aquí tienes unas cuantas observaciones para tranquilizarte (cada una de ellas es fácilmente comprobable):
- Si $p=x^n$ para que $\hat{p}(a) = a^n$ entonces $\hat{q}(a) = n \cdot a^{n-1}$ . En otras palabras, la regla de potencia "normal" se recupera con esta definición.
- Para cualquier $a$ la asignación $p \in R[x] \mapsto \hat{q}(a)$ es lineal. En otras palabras, la linealidad "normal" de la operación de la derivada se preserva con esta genralización.
- La regla del producto también funciona, aunque es difícil de expresar desde el punto de vista de la notación, y no vale la pena.
4 votos
Los enteros se incrustan de forma natural en cualquier anillo con unidad : $n = \underbrace{1+ \ldots+1}_n$ y $-n = \underbrace{(-1)+ \ldots+(-1)}_n$
1 votos
@user1952009: Incluso a $\{0,1\}$ ? Eso es muy ¡interesante desde el punto de vista de la teoría de conjuntos! :)
4 votos
@user1952009: No es "incrustación" (como indirectamente insinúa Asaf) sino simplemente "homomorfismo".
0 votos
@CJDowd Por eso muchos cursos de álgebra utilizan $R[X]$ para denotar el anillo polinómico, en lugar de $R[x]$ : es demasiado fácil pensar en $p(x)$ como una función y no como una simple expresión formal. Ya que hay una convención tan común de que las variables están en minúsculas, $P(X)$ es menos evidente que una función y más que una expresión formal.
0 votos
@user21820 El inglés no es mi lengua materna. Entonces, ¿dices que 'incrustar' significa inyectar?
0 votos
@user1952009: Sí; ver aquí .
0 votos
@user21820 ¿Y si decimos que la expresión formal $n = \underbrace{1+ \ldots+1}_n$ se incrusta de forma natural en cualquier anillo con unidad ?
1 votos
@user1952009: "Incrustar" no es la palabra adecuada en este caso. Lo que yo diría es que $n$ tiene sentido en cualquier anillo con unidad.
0 votos
@user1952009: Incrustar significa como una copia isomórfica. No se puede obtener una copia isomórfica de ninguna estructura infinita en una finita. Como en mi primer comentario, lo que quieres es "homomorfismo", que sólo requiere que el mapa conmute con las operaciones de la estructura; $f(a+b) = f(a)+f(b)$ y $f(ab) = f(a) f(b)$ , donde $f$ es el homomorfismo y $a,b$ son cualquier número entero. $f$ puede definirse por inducción para cualquier anillo objetivo $R$ , ya sea o no $R$ tiene una característica distinta de cero.