24 votos

Definiendo la derivada sin límites

En estos días, la forma estándar de presentar el cálculo diferencial es introduciendo la definición de límite de Cauchy-Weierstrass. Luego se define la derivada como un límite, se demuestran resultados como las reglas de Leibniz y de la cadena, y se utiliza esta maquinaria para diferenciar algunas funciones simples como los polinomios. El propósito de mi pregunta es ver qué alternativas creativas pueden describir las personas a este enfoque. La naturaleza de la pregunta es que no habrá una única mejor respuesta. Tengo varios métodos que he recopilado los cuales pondré como respuestas a mi propia pregunta.

No es razonable esperar que las respuestas incluyan un tratamiento completo de un libro introductorio de diferenciación, ni tampoco alguien querría leer respuestas tan extensas. Un esbozo está bien. La falta de rigor está bien. Se puede asumir notación y terminología bien conocidas. Sería bueno desarrollar las cosas hasta el punto en que se pueda diferenciar un polinomio, ya que eso ayudaría a ilustrar cómo funciona tu método y demostrar que es usable. Para este propósito, basta con probar que si $n>0$ es un entero, la derivada de $x^n$ es igual a $0$ en $0$ y es igual a $n$ en $1; el resultado en otros valores no nulos de $x$ sigue por escala. Hacer esto para $n=2$ está bien si la generalización a $n>2$ es obvia.

3 votos

1 votos

No estoy seguro de lo que está sucediendo aquí. Puedo entender hacer una pregunta con el fin de dar una respuesta. Pero ¿dar dos? Parece más material de blog que una publicación en MSE.

0 votos

6voto

Lissome Puntos 31

Cuando enseñé Teoría de Números necesitaba hablar de la derivada para un polinomio (sobre $\mathbb Z$ y $\mathbb Z/p \mathbb Z$). En lugar de tomar la derivada de $\mathbb R$ y restringirla a $\mathbb Z$, usé el siguiente enfoque, que funciona solo para polinomios (pero funcionaría en cualquier anillo de polinomios).

Sea $P(X)$ un polinomio, y $a$ un punto. Entonces por el Teorema de la División tenemos

$$P(X)=(X-a)Q(X) +R \,.$$

donde $R$ es una constante. Definimos

$$P'(a):= Q(a) \,. \quad (*)$$

Es importante señalar que $Q(X) \neq P'(X)$ en general, ya que en diferentes puntos obtenemos diferentes $Q's$.

El siguiente Lema es una consecuencia inmediata de $(*)$:

Lema

1) $(P_1 \pm P_2)' =P_1'+P_2'$

2) $(aP)'=aP'$

3) $(a)'=0

4) $(X^n)'=n X^{n-1}$.

Por lo tanto, se obtiene la fórmula general para la derivada de un polinomio.

La regla del producto también se puede demostrar relativamente fácil, y luego uno puede realmente demostrar que

$$P(X)=P(a) + P'(a)(X-a)+ \frac{P''(a)}{2!}(x-a)^2+...+ \frac{P^{(n)}(a)}{n!}(x-a)^n \,,$

donde $n$ es el grado del polinomio.

También se deduce de aquí que $a$ es una raíz múltiple de $P(X)$ con multiplicidad $k$ si y solo si $P(a)=P'(a)=...=P^{(k-1)}(a)=0$ y $P^{(k)}(a) \neq 0$.

Este es un enfoque puramente algebraico, funciona bien para polinomios en cualquier anillo y probablemente se pueda extender fácilmente a funciones racionales, pero no mucho más generalmente.

Nota que $R=P(a)$, por lo tanto para todo $x \neq a$ tenemos $Q(X)=\frac{P(X)-P(a)}{x-a}$, por lo que esta definición es equivalente a la definición estándar en $\mathbb R$.

También, note que $P''(a) \neq Q'(a)$ en $(*)$. De hecho, a partir de la regla del producto se obtiene $P''(a) =P'(a)+Q'(a)$.

0 votos

La expansión de Taylor más allá de la primera derivada no funciona en todos los anillos: los factoriales $2!,\dots,n!$ deben ser invertibles en el anillo. Especialmente tendrías problemas sobre ${\mathbf Z}/(p)$ si $n \geq p.

5voto

Bluebird75 Puntos 4612

Definición:
Dada una función $x(t)$, consideremos cualquier punto $P=(a,x(a))$ en su gráfica. Sea la función $\ell(t)$ una línea que pasa por $P$. Decimos que $\ell$ corta a $x$ en $P$ si existe algún número real $d>0$ tal que la gráfica de $\ell$ está en un lado de la gráfica de $x$ para todos los $a-d < t < a$, y está en el otro lado para todos los $a < t < a+d$.

Definición (Marsden):
Una línea $\ell$ que pasa por $P$ se dice que es la línea tangente a $x$ en $P$ si todas las líneas que pasan por $P$ con pendientes menores que la de $\ell$ cortan a $x$ en una dirección, mientras que todas las líneas con pendientes mayores que la de $P$ cortan a en la dirección opuesta.

Definición:
La derivada de una función es la pendiente de su línea tangente en un punto dado.

Teorema (Livshits):
La derivada de $t^k$ es $kt^{k-1}$, para $k=1, 2, 3, \ldots$

Basta con demostrar que la derivada es igual a $k$ cuando se evalúa en $t=0$ y $1$. El resultado en $t=0$ es válido para $n$ par por simetría, y para $n$ impar por aplicación de la definición.

Queda por demostrar el resultado en $t=1$. La línea tangente propuesta en $(1,1)$ tiene la ecuación $\ell(t)=k(t-1)+1$, así que lo que necesitamos demostrar es que el polinomio $t^k-[k(t-1)+1]$ es mayor o igual a cero en alguna región alrededor de $t=1$. Demostraremos que es $\ge 0$ para $t \ge 0$.

Supongamos que $\ell$ cruza a $t^k$ en el punto $(t,t^k)$. Entonces la pendiente de $\ell(t)$ es $k$, así que debemos tener \begin{equation*} \frac{t^k-1}{t-1} = k. \end{equation*} El lado izquierdo está dado por $Q(t)=\sum_{j=0}^{k-1}t^j$. ¿Dónde obtenemos $Q(t)=k$? Claramente tenemos una solución para $t=1$, ya que hay $k$ términos, cada uno igual a $1$. Para $t>1$, todos los términos excepto el constante son mayores a $1$, así que no puede haber ninguna solución. Para $0 \le t < 1$, todos los términos excepto el constante son positivos y menores a $1$, así que de nuevo no puede haber ninguna solución. Esto completa la prueba.

Referencias

3voto

Michael Hardy Puntos 128804

A continuación se presenta una caracterización de las derivadas de polinomios en álgebra en lugar de cálculo, lo cual podría ser... um... tangencialmente relevante.

Una aplicación lineal de polinomios en $x$ a polinomios en $x$ está determinada por las imágenes de $1, x, x^2, x^3, \ldots$. Si dicha aplicación lleva a $x^n$ a un múltiplo escalar de $x^{n-1}$, entonces es equivariante al desplazamiento solo si lleva a $x^n$ a $nx^{n-1}$.

Nota posterior: Se sugiere en los comentarios que algunas personas no saben qué significa "equivariante al desplazamiento". Si $g(x) = f(x-c)$, entonces $g$ es un desplazamiento de $f. Supongamos que $Tf$ es la imagen de $f$ bajo una aplicación lineal del tipo contemplado aquí. Si $(Tf)(x-c)=(Tg)(x)$ para todos los $f$ y todos los escalares $c$, con $g$ como se describe arriba, entonces $T$ es equivariante al desplazamiento. La diferenciación es equivariante al desplazamiento; algunas aplicaciones lineales no lo son (por ejemplo, la multiplicación por $x$).

0 votos

Estoy tentado de dar +1 por la entrega del juego de palabras.

1 votos

Bonito y simple. Para aquellos que, como yo, no conocían la definición de shift-equivariant, aquí está: en.wikipedia.org/wiki/Delta_operator Queda la posibilidad lógica de que la diferenciación de un monomio dé un polinomio con dos o más términos. Pero esta es definitivamente una buena forma de determinar el factor de $n$.

0 votos

Me deshice de esa "posibilidad lógica" (¡que de hecho se realiza en algunos ejemplos!) bastante fácilmente: por hipótesis (como verás si miras cuidadosamente lo que escribí arriba).

3voto

fgp Puntos 15322

Comienza con polinomios solamente. Dado un polinomio $p(x) = \sum_{i=0}^n a_ix^i$ y un punto $x_0$, asegúrate de que existe otro polinomio $\tilde{p}(x) = \sum_{i=0}^n b_ix^i$ tal que $$ p(x) = \tilde{p}(x-x_0). $$

Ahora observa qué sucede si evalúas $\tilde{p}(x-x_0)$ para un $x$ que está cerca de $x_0$. $(x-x_0)^i$ entonces decaerá muy rápidamente, por lo que $\tilde{p}(x-x_0)$ no diferirá mucho de $b_0 + b_1(x-x_0)$. En otras palabras, $b_0 + b_1(x-x_0)$ es una buena aproximación de $p$ siempre y cuando no nos alejemos demasiado de $x_0$. Ahora, solo tenemos que encontrar realmente $b_0$ y $b_1.

$b_0$ es obviamente simplemente $p(x_0)$, así que lo que queda es encontrar $b_1$, es decir, el coeficiente de $x$ en $p(x+x_0)$. Una vez que te das cuenta de que expandir $(x+c)^k$ produce $k$ veces el término $xc$ y que ningún otro término contiene exactamente una $x$, es claro que $$ b_1 = a_1 + a_22x_0 + a_33x_0^2 + a_44x_0^3 + \ldots $$

La aproximación de primer orden de $p$ alrededor de $x_0$ es entonces $p(x_0) + x\sum_{i=1}^n a_iix_0^{i-1}$ lo que hace evidente que la pendiente de $p(x)$ alrededor de $x_0$ es $$ p'(x) = \sum_{i=1}^n a_iix_0^{i-1} $$

El ingrediente clave (y el reemplazo de los límites explícitos) es la idea de que para valores pequeños $\epsilon$, $\epsilon^2$ y potencias superiores son suficientemente cercanas a cero como para ser ignoradas.

2voto

Bluebird75 Puntos 4612

Lo siguiente está destinado a ser una axiomatización del cálculo diferencial de una sola variable. Para evitar complicaciones, digamos que $f$, $g$, $f'$ y $g'$ son funciones suaves de $\mathbb{R}$ a $\mathbb{R}$ ("suave" siendo definido por la definición de la derivada usual de Cauchy-Weierstrass, no por estos axiomas, es decir, no quiero preocuparme por puntos no diferenciables en este momento). En todos estos casos, asumir los cuantificadores obvios como $\forall f \forall g$.

Axioma Z: $\exists f : f'\ne 0$

Axioma A: $(f+g)'=f'+g'$

Axioma C: $(g \circ f)'=(g'\circ f)f'$

Una parte de lo siguiente es mi presentación del razonamiento presentado en una publicación por Tom Goodwillie: https://mathoverflow.net/questions/108773/independence-of-leibniz-rule-and-locality-from-other-properties-of-the-derivative/108804#108804. Toda esta respuesta es una presentación abreviada y purificada de lo que se trabajó en esa pregunta de MO.

Teoremas:

(1) La derivada de la función identidad $I$ es 1. -- Aplicando el axioma C a $I=I\circ I=I\circ I\circ I$ muestra que $I'$ es igual a 0 o 1 en todas partes. Dado que se asume continuidad, $I'$ tiene el mismo valor en todas partes. Por Z y C, ese valor no puede ser 0.

(2) La derivada de una función constante es 0. -- A partir de A y (1) podemos mostrar que la derivada de $-I$ es $-1$. La composición de la función constante con $-I$ luego muestra que la derivada de la constante es 0, evaluada en 0.

(3) La derivada de $cx$, donde $c$ es una constante, es $c$. -- Al pre o post componer con una traslación, vemos que la derivada debe ser una constante $h(c)$. La función $h$ es un homomorfismo de los reales con $h(1)=1$, así que $h=c$.

(4) La derivada de $cf$, donde $c$ es una constante, es $cf'$. -- Esto se sigue de (3) y C.

(5) La derivada de una función par en 0 es 0. -- Axioma C.

(6) La derivada de $s(x)=x^2$ es $2x$. -- Sea $u(x)=s(x+1)-s(x)=2x+1$. Luego $u'=2$. Por (5), $s'(0)=0$. Por lo tanto $s'(1)=2$. La pre composición con una función de escalamiento establece entonces el resultado para todo $x$.

(7) Para cualquier función $f$ y $g$, $(fg)'=f'g+g'f$. -- Escribe $2fg=(f+g)^2-f^2-g^2$ y aplica (6).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X