26 votos

Definición rigurosa de "diferencial"

Cuando se trata de definiciones, seré muy estricto. La mayoría de los libros tienden a definir la diferencial de una función/variable de la siguiente manera:


Sea $f(x)$ una función diferenciable. Al asumir que los cambios en $x$ son lo suficientemente pequeños, podemos decir: $$\Delta f(x)\approx {f}'(x)\Delta x$$ Donde $\Delta f(x)$ son los cambios en el valor de la función. Ahora definimos la diferencial de $f(x)$ de la siguiente manera: $$\mathrm{d}f(x):= {f}'(x)\mathrm{d} x$$ Donde $\mathrm{d} f(x)$ es la diferencial de $f(x)$ y $\mathrm{d} x$ es la diferencial de $x$.


Lo que me molesta de esta definición es que es completamente circular. Es decir, estamos definiendo la diferencial con la propia diferencial. ¿Podemos definir la diferencial de manera más precisa y rigurosa?

P.D. ¿Es posible definir la diferencial simplemente como el límite de una diferencia a medida que la diferencia se aproxima a cero?: $$\mathrm{d}x= \lim_{\Delta x \to 0}\Delta x$$ Gracias de antemano.


EDIT:

Sigo creyendo que no capturé la mejor respuesta. Prefiero que la respuesta esté en el contexto de "Cálculo" o "Análisis" en lugar de la "Teoría de Formas Diferenciales". Y de nuevo, no quiero una definición circular. Creo que es posible definir la "Diferencial" con el uso de "Límites" de alguna manera. Gracias de antemano.


EDIT 2 (Respuesta al comentario de "Mikhail Katz"):

la explicación que di en términos del sistema de números hiperreales que contiene infinitesimales parece responder a tus preocupaciones. Estaré encantado de aclarar si algo parece confuso. - Mikhail Katz

Gracias por tu ayuda. Tengo dos problemas:

En primer lugar, definimos la diferencial como $\mathrm{d} f(x)=f'(x)\mathrm{d} x$ y luego nos engañamos pensando que $\mathrm{d} x$ no es más que otra representación de $\Delta x$ y luego, sin aclarar la razón, tratamos $\mathrm{d} x$ como la diferencial de la variable $x y luego escribimos la derivada de $f(x)$ como la razón de $\mathrm{d} f(x)$ a $\mathrm{d} x$. Así que literalmente (y también engañando sigilosamente) definimos la "Diferencial" por otra diferencial y es circular.

En segundo lugar (al menos creo que) podría ser posible definir la diferencial sin tener ningún conocimiento de la noción de derivada. Así que podemos definir "Derivada" y "Diferencial" de forma independiente y luego deducir que la relación $f'{(x)}=\frac{\mathrm{d} f(x)}{\mathrm{d} x}$ es solo un resultado natural de sus definiciones (usando posiblemente la noción de límites) y no está relacionado con la definición en sí misma.

Sé que la relación $\mathrm{d} f(x)=f'(x)\mathrm{d} x$ siempre funciona y siempre nos dará una manera de calcular diferenciales. Pero yo (como una persona estrictamente axiomática) no podría aceptarla como una definición de Diferencial.


EDIT 3:

Respuesta a los comentarios:

No conozco ningún libro de texto que defina las diferenciales de esta manera. ¿Qué tipo de libros has estado leyendo? - Najib Idrissi

¿Qué libros? - m_t_

Consulta "Cálculo y Geometría Analítica", "Thomas-Finney", 9ª edición, página 251

y "Cálculo: Trascendentes Tempranas", "Stewart", 8ª edición, página 254

Literalemente definieron diferencial por otra diferencial.

36voto

guestDiego Puntos 542

Por supuesto, definir $$ \mathrm{d}x= \lim_{\Delta x \to 0}\Delta x $$ es lo mismo que definir $$ dx=0, $$ lo cual no tiene sentido. El enfoque correcto es definir el diferencial como un tipo de función lineal: el diferencial $df(x)$ (a veces denotado por $df_x$) es la función lineal definida por $$ df(x):\mathbb R\to\mathbb R\qquad t\mapsto f'(x)\cdot t $$ En particular $$ dx:\mathbb R\to\mathbb R\qquad t\mapsto t $$ Por lo tanto, también se puede escribir $ df(x)=f'(x)dx$ (la composición con el mapa identidad). Esto suena quizás trivial para funciones escalares $f$. El concepto es más interesante para funciones vectoriales de variables vectoriales: en ese caso $df(x)$ es una matriz. El diferencial $df(x_0)$ debe interpretarse como la mejor función lineal que aproxima la función incremental $h(x):=f(x)-f(x_0)$ cerca de $x=x_0. En este sentido, el concepto está conectado a la idea que has expresado a través de la 'ecuación' aproximada $\Delta f(x)\approx {f}'(x)\Delta x$

10voto

Existen dos formas de definir la diferencial de $y=f(x)$:

(1) como formas diferenciales. Aquí, $dx$ es una función lineal en el espacio tangente (en este caso la recta tangente) en un punto, y la fórmula $dy=f'(x)dx$ es una relación entre 1-formas.

(2) como un número infinitesimal. Dicho número es un elemento del sistema de números hiperreales, como se detalla en el excelente libro de texto de H. J. Keisler titulado Cálculo Elemental que actualmente estamos utilizando para enseñar cálculo a 150 estudiantes de primer año.

Aquí, la variable independiente $\Delta x$ es un infinitesimal, se define $f'(x)=\textbf{st}(\frac{\Delta y}{\Delta x})$ donde "$\textbf{st}$" es la función de parte estándar (o sombra) y $\Delta y$ es la variable dependiente (también infinitesimal cuando existe la derivada). Se define una nueva variable dependiente $dy$ estableciendo $dy=f'(x)dx$ donde $dx=\Delta x$. Nota que es solo para la variable independiente $x$ que establecemos $dx=\Delta x$ (por lo tanto no hay circularidad).

La ventaja de esto es que se puede calcular la derivada $\frac{dy}{dx}$ a partir de la razón de infinitesimales $\frac{\Delta y}{\Delta x}$, en lugar de solo una aproximación; la demostración de la regla de la cadena se vuelve más intuitiva; etc.

Más generalmente, si $z=f(x,y)$ entonces la fórmula $dz=\frac{\partial f}{\partial x} dx + \frac{\partial f}{\partial y}dy$ tiene dos interpretaciones: como una relación entre formas diferenciales 1, o como una relación entre diferenciales infinitesimales. Autores clásicos como Riemann interpretaron tales relaciones como una relación entre diferenciales infinitesimales.

No es posible definir $dx$ mediante un límite como en $\mathrm{d}x= \lim_{\Delta x \to 0}\Delta x$ (como escribiste) porque simplemente sería cero, pero una generalización del límite llamada ultralímite, como popularizado por Terry Tao, funciona perfectamente y produce un valor infinitesimal para $dx$.

Más específicamente, con respecto a tu esperanza de alguna manera "definir diferenciales con la ayuda de límites", se puede decir lo siguiente. La noción de límite puede ser refinada a la noción de un ultralímite refinando la relación de equivalencia involucrada en la definición del límite. Así el límite de una secuencia $(u_n)$ funciona de tal manera que si $(u_n)$ tiende a cero entonces el límite es necesariamente cero exacto. Esto no deja mucho espacio para los infinitesimales. Sin embargo, la noción refinada, el ultralímite, de una secuencia $(u_n)$ que tiende a cero es típicamente un infinitesimal distinto de cero, digamos $dx$. Luego podemos usar esto como punto de partida para todas las definiciones en el cálculo, incluyendo la continuidad y la derivada. La fórmula $dy= f'(x) dx$ entonces literalmente tiene sentido para diferenciales no nulos $dx$ y $dy$ (a menos que por supuesto $f'(x)=0$ en cuyo caso $dy=0$).

La definición no es circular porque el infinitesimal $\Delta y$ se define como el incremento de $y$ $f(x+\Delta x)-f(x)$. Este fue básicamente el enfoque de Leibniz (los diferenciales son simplemente infinitesimales) y rara vez hacía cosas que fueran circulares.

7voto

Markus Scheuer Puntos 16133

Consideramos una función de valor real $y=f(x)$ diferenciable en $x=x_0$.

El razonamiento siguiente se puede encontrar en la sección 3.7 de Höhere Mathematik, Diferencial e Integral por Hans J. Dirschmid.

Definición: Llamamos al cambio de la parte lineal de $f$ en $x=x_0$ considerada como función del incremento del argumento $\Delta x$ la diferencial de la función $f$ en $x_0$, simbólicamente \begin{align*} dy=f^\prime(x_0)\Delta x\tag{1} \end{align*> La parte lineal de $f$ en $x_0$ es la expresión \begin{align*> f(x_0)+f^\prime(x_0)\Delta x \end{align*>

Observa que introducimos el término $dy$ en (1) sin usar $dx$ y así evitamos cualquier razonamiento circular.

Aquí hay una pequeña figura para ilustrar:

                                        enter image description here

Cuando hablamos de la diferencial $dy$ la usamos tanto como un símbolo de función y como el valor de la función $dy$ evaluado en $\Delta x$. \begin{align*> dy=dy(\Delta x)=f^\prime(x_0)\Delta x\tag{2} \end{align*>

$$ $$

Conexión con $dx$:

Consideramos la función identidad $y=x$. Dado que $y^\prime=1$ obtenemos por (2) \begin{align*> dy=1\cdot \Delta x=\Delta x \end{align*> Dado que $y=x$ y $dy=\Delta x$ usamos esta relación para definir \begin{align*> dx:=\Delta x \end{align*> y lo llamamos la diferencial de $x.

Con este enfoque de dos pasos podemos escribir $dy=f^\prime(x_0)\Delta x$ como \begin{align*> dy=f^\prime (x_0) dx\tag{3} \end{align*> y resolver la aparente definición circular.

[Add-on 2016-11-15]:

A partir de (3) vemos que las diferenciales $dy$ y $dx$ son proporcionales como funciones de $\Delta x$. Dado que podemos dividir funciones reales, también podemos considerar el cociente \begin{align*> \frac{dy}{dx}=f^\prime(x_0)\tag{4} \end{align*> Esto justifica el término cociente diferencial.

Observa que el lado izquierdo de (4) es el cociente de dos funciones dependientes del incremento del argumento $\Delta x$ que no aparece en el lado derecho. Esto implica que el cociente no depende del argumento $\Delta x$ del numerador $dy$ y del denominador $dx$.

$$ $$

Aproximación de $f$ en $x=x_0$:

La parte lineal $$f(x_0)+f^\prime(x_0)\Delta x$$ aproxima la función $f$ en $x=x_0$ con un error que disminuye con un orden superior al primer orden. Esto implica que el cambio de la parte lineal - la diferencial $dy$ - aproxima el cambio de la función, que es la diferencia $\Delta y=f(x+\Delta x)-f(x)$ también con esta calidad de error: \begin{align*> \Delta y=dy+\Delta x \varepsilon(\Delta x),\qquad \lim_{\Delta x\rightarrow 0}\varepsilon(\Delta x)=0. \end{align*>

3voto

Vihang D Puntos 444

Creo que la versión de formas diferenciales merece ser desarrollada un poco más:

Sean $x, y, z, \ldots$ todas las variables escalar utilizadas. Escribimos $p$ para una tupla que asigna valores a esas variables: $(x_p, y_p, z_p, \ldots)$. Entonces una cantidad variable es una función matemática que asigna un valor (real o vectorial) a cada tupla $p$. Nota que las variables son cantidades variables bien definidas dadas por

$$x(x_p, y_p, z_p, \ldots) = x_p\\ y(x_p, y_p, z_p, \ldots) = y_p\\ z(x_p, y_p, z_p, \ldots) = z_p\\ \vdots$$

Para cada cantidad variable $E$, vamos a definir otra cantidad $dE$. En particular, si $E$ es una cantidad variable real, la diferencial de $E$ $dE$ será una función parcial que asigna a cada asignación $p$ una transformación lineal del espacio vectorial de asignaciones al espacio vectorial de números reales (bajo adición). Si $E$ es una variable vectorial, $dE$ mapeará cada $p$ a una transformación lineal del espacio vectorial de asignaciones al espacio vectorial donde $E$ toma sus valores (esto es una generalización de la definición para variables reales).

Si $\Delta p$ es un pequeño desplazamiento de la asignación $p$, queremos que $E(p) + dE(p)\Delta p$ sea una buena aproximación de $E(p + \Delta p)$. Primero notamos que $$dE(p)\Delta p \to 0 \text{ cuando } \Delta p \to 0$$ por definición, ya que queremos que $dE(p)$ sea lineal. Así que a menos que $$E(p + \Delta p) \to 0 \text{ cuando } \Delta p \to 0$$ es decir, $E$ es continua, $E(p) + dE(p)\Delta p$ nunca será una buena aproximación de $E(p + \Delta p) . Así que solo vamos a mirar puntos $p$ donde $E$ es continua (puede que no haya tales puntos).

Por otro lado, $$E(p) + Q\Delta p \to E(p) \text{ cuando } \Delta p \to 0$$ para todas las transformaciones lineales $Q$, así que eso no puede ser una definición suficiente de $dE(p) . Consideremos lo siguiente: $$x \to 0 \text{ cuando } x \to 0\\ x^2 \to 0 \text{ cuando } x \to 0$$, pero $$\frac{x}{x} \to 1 \text{ cuando } x \to 0\\ \frac{x}{x^2} \to \infty \text{ cuando } x \to 0\\ \frac{x^2}{x} \to 0 \text{ cuando } x \to 0$$ Intuitivamente, podemos ver que $x$ y $x^2$ van a 0 a distintas velocidades a medida que $x \to 0$. Podemos usar esa idea para definir $dE(p)$ más precisamente. Como mínimo, queremos que $E(p) + dE(p)\Delta p$ vaya hacia $E(p)$ más rápido que $\Delta p$ vaya a 0. Podemos escribir esto formalmente (rigurosamente) como $$\frac{E(p + \Delta p) - E(p) - dE(p)\Delta p}{\|\Delta p\|} \to 0 \text{ cuando } \Delta p \to 0$$ Nota que esto es precisamente lo mismo que definir $dE(p)$ como la derivada (vectorial) de $E$ en $p$. La unicidad de la transformación lineal (si existe) que satisface esa propiedad (la mejor aproximación lineal a $E$ en $p) es un teorema básico demostrado en cualquier libro de análisis vectorial.

La cantidad variable $f(x)$ es realmente una composición: $f(x)(p)$ en realidad significa $f(x(p))$. Así que la regla $$d(f(x)) = f'(x)dx$$ (que realmente significa $$d(f(x))(p) = f'(x(p))(dx(p))$$) es solo una aplicación simple de la regla de la cadena.

3voto

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X