82 votos

Cómo tratar los diferenciales y infinitesimals?

En mi clase de Cálculo, mi profesor de matemáticas dijo que los diferenciales tales como $dx$ no son números, y no debe ser tratado como tal.

En mi clase de física, me parece que el tratamiento de los diferenciales exactamente como los números, y mi profesor de física, incluso se dice que son, en esencia, números muy pequeños.

Alguien puede darme una explicación que satisfaga a ambas clases, o ¿sólo tengo que aceptar que los diferenciales son tratados de manera diferente en los distintos cursos?

P. S. me tomó Cálculo 2 así que por favor trate de mantener las respuestas en torno a ese nivel.

P. S. S. Siéntase libre de editar las etiquetas si usted piensa que es apropiado.

37voto

Joakim Bodin Puntos 161

Hay una vieja tradición, de ir todo el camino a Leibniz a sí mismo y llevado en un lote en departamentos de física, a pensar de las diferencias de forma intuitiva como "infinitesimal números". A través del curso de la historia, las grandes mentes han criticado Leibniz para esto (por ejemplo, la otra gran Bertrand Russell en el Capítulo XXXI de "Una Historia de la Filosofía Occidental" (1945)) como los informales y no científico.

Pero entonces algo más profundo que sucedió: William Lawvere, uno de los pensadores más profundos de los fundamentos de las matemáticas y de la física, enseñado al mundo acerca de la teoría de topos y allí sobre la "sintético de la geometría diferencial". Entre otras cosas, este es un matemático riguroso contexto en el que la vieja intuición de Leibniz y la intuición de un montón de ingenuos físicos encuentra una plena justificación formal. En el Sintético de la geometría diferencial los diferenciales de forma explícita ("sintéticamente") existen como elementos infinitesimales de la línea real.

Una exposición básica de cómo funciona esto es en el nLab en

Aviso que esto no es sólo una gran máquina para producir algo que ya conoce, ya que algunas inevitablemente tendrán que apresurarse a pensar. Por el contrario, esto conduce a que el camino hacia el más sofisticado de los lugares de la física moderna. Es decir, la "deriva" o "superior geométrica" de la versión de sintético de la geometría diferencial incluye modernas D-geometría que está en el corazón, por ejemplo de la moderna temas tales como la BV-BRST formalismo (ver, por ejemplo, Paugam de la encuesta) para la cuantización de teorías gauge, o por ejemplo geométrico de Langlands correspondencia, por lo tanto S-dualidad en la teoría de cuerdas.

17voto

Vivek Puntos 51

(Hablaré de esto desde el punto de vista de análisis estándar)

No creo que usted tendrá una comprensión satisfactoria de este hasta que se vaya a multivariable de cálculo, debido a que en el cálculo 2 es fácil pensar que $\frac{d}{dx}$ es todo lo que usted necesita y que no hay necesidad de $\frac{\partial}{\partial x}$ (Esto es falso y tiene que ver con el por qué, en general, los derivados no siempre se comportan como fracciones). Así que esa es una razón por la que los diferenciales no son como los números. Hay algunas maneras en que los diferenciales son como los números, sin embargo.

Creo que es el más fundamental de bits es que si te dicen que $f dx=dy$, esto significa que $y$ se puede aproximar como $y(x)=y(x_0)+f\cdot(x-x_0)+O((x-x_0)^2)$ cerca del punto de $x_0$ (esto plantea otro problema*). Desde este primer fin de plazo es realmente todo lo que importa, después de que uno se aplica la limitación de los procedimientos de cálculo, esto le da un argumento de por qué tal un tratamiento inadecuado de los diferenciales de la permitida - los términos de orden superior no importa. Esto es una consecuencia del teorema de Taylor, y es lo que permite que su profesor de física para el tratamiento de los diferenciales como los números muy pequeños, debido a que $x-x_0$ es como su "dx" y ES un número real. Lo que te permite hacer cosas que no puedes hacer con un único número real es que esa fórmula para $y(x)$ mantiene para todos los $x$, no solo algunos x. Esto le permite aplicar todos los complicados trucos de análisis.

Si me llega especialmente molesto por el tratamiento inadecuado de los diferenciales y los veo a alguien trabajando a través de un ejemplo en el que se escribe, "Ahora tomamos el diferencial de $x^2+x$ dándonos $(2x+1)dx$", puedo imaginar $dx$ ser un estándar número real, y que hay un poco de $+O(dx^2)$ viró hacia el lado.

Su profesor de matemáticas podría argumentar, "Usted no sabe lo suficiente acerca de los teoremas de aplicar correctamente, así que por eso no se puede pensar de las diferencias como similar a la de los números", mientras que su profesor de física podría argumentar, "la intuición es La realmente importante, y usted tendría que aprender matemáticas complicadas para ver como $O(dx^2)$. Mejor centrarse en la intuición".

Espero haber aclarado las cosas en lugar de hacerlas parecer más complicado.

*(El O la notación es otra lata de gusanos y también puede ser utilizado de forma inadecuada. El uso de los enlaces de la notación que yo estoy diciendo "$y(x)-y(x_0)-f\cdot(x-x_0)=O((x-x_0)^2)$$x\to x_0$". Tenga en cuenta que uno podría ver esto como trabajo en contra de mi argumento no tiene sentido decir "un valor de $x$ satisface esta ecuación", por lo que cuando se escriben en este formulario (que su física prof. puede encontrar más obtusa y su profe de matemáticas. puede encontrar más significativo) es menos de una ecuación y más de una instrucción lógica.)

Vea también: http://mathoverflow.net/questions/25054/different-ways-of-thinking-about-the-derivative

13voto

Kagaratsch Puntos 343

Creo que su profesor de matemáticas es el adecuado. Una forma de ver que los diferenciales no son normales números es buscar en su relación con los llamados 1-formas. No sé si ya han tenido formas de cálculo 2, pero es fácil buscar en el internet.

Puesto que usted eligió una etiqueta de "integrales" en su pregunta, permítanme darles un ejemplo basado en una integral. Digamos que usted tiene una función de $f(x^2+y^2)$ y se quieren integrar sobre algunos de área $A$:

$$\int_A f(x^2+y^2) dx dy$$

La cosa importante a tener en cuenta es, que el $dxdy$ es en realidad una abreviatura para $dx\wedge dy$. Esta $\wedge$ cosita es una operación (cuña producto se parece mucho a la multiplicación, pero con un poco diferentes reglas) que se pueden combinar de formas (en este caso combina dos de 1-formas para una 2-forma). Una regla importante para que la cuña de productos anti-conmutación:

$$dx\wedge dy=-dy\wedge dx$$

Esto se asegura de que $dx\wedge dx=0$ (donde un físico podría engañar diciendo que él ignora todo de orden $O(dx^2)$, pero eso es como mezclar peras y manzanas, francamente engañosa). ¿Por qué los diferenciales en las integrales se comportan como esta y donde es el significado físico? Bien, aquí usted puede pensar acerca de la 'imparcialidad' de un sistema de coordenadas. Por ejemplo, la integración de medida $dx\wedge dy\wedge dz$ es cartesiano 'mano derecha'. Usted puede hacer que sea 'zurdo' por la conmutación de la $dx$ $dy$ obtener $-dy\wedge dx\wedge dz$, pero luego el signo menos que aparece en la parte delantera, que se asegura de que su integración en un 'zurdo' sistema de coordenadas todavía le da el mismo resultado que en el inicial 'mano derecha'.

En cualquier caso, para regresar a la integral anterior ejemplo, digamos que te gusta coordenadas polares mejor para realizar su integración. Así que hacer la siguiente sustitución (suponiendo que usted ya sabe cómo tomar el total de los diferenciales):

$$x = r \cos \phi~~~,~~~dx = dr \cos \phi - d\phi\, r \sin \phi$$ $$y = r \sin \phi~~~,~~~dy = dr \sin \phi + d\phi\, r \cos \phi$$

Multiplicando su $dx\wedge dy$ encontrar lo que usted probablemente ya saben y esperan:

$$dx\wedge dy = (dr \cos \phi - d\phi\, r \sin \phi)\wedge(dr \sin \phi + d\phi\, r \cos \phi)$$ $$ = \underbrace{dr\wedge dr}_{=0} \sin \phi\cos \phi + dr\wedge d\phi\, r \cos^2 \phi - d\phi\wedge dr\, r \sin^2 \phi - \underbrace{d\phi\wedge d\phi}_{=0}\, r^2 \cos \phi \sin \phi $$ $$=r(dr\wedge d\phi \cos^2 \phi - d\phi\wedge dr \sin^2 \phi)$$ $$=r(dr\wedge d\phi \cos^2 \phi + dr\wedge d\phi \sin^2 \phi)$$ $$=r\, dr\wedge d\phi ( \cos^2 \phi + \sin^2 \phi)$$ $$=r\, dr\wedge d\phi $$

Con esto la integral anterior se expresa en coordenadas polares se lea correctamente:

$$\int_A f(r^2)r\, dr d\phi$$

Donde se suprimió la cuña del producto aquí. Es importante tener en cuenta, que si no nos han tratado a los diferenciales de 1-formas aquí, la transformación de la integración de medida $dx dy$ en el de $dr$ $d\phi$ no han trabajado correctamente!

Espero que este ejemplo fue a la tierra lo suficiente y proporciona una sensación de cómo los diferenciales no son totalmente números muy pequeños.

9voto

Tom-Tom Puntos 1461

En matemáticas, la notación $\def\d{\mathrm d}\d x$ es en realidad una forma lineal, esto significa que $\d x$ es una función lineal de tomar un vector que dar un escalar.

Tomemos una función derivable $f$ definido a lo largo del $\def\R{\mathbf R}\R$, y consideramos que es en el punto de $a$. La tangente a la curva de $f$ en el punto de $a$ tiene una pendiente $f'(a)$. El punto en este tangente de abscisa $b$ tiene de coordenadas $f_a(b)=f(a)+(b-a)f'(a)$. $f_a(b)$ es la aproximación lineal de $f(b)$ conocer $f$ a punto de $a$.

Definimos a continuación,$\d x(b-a)=b-a$. Tenemos $$f_a(b)-f(a)=f'(a)\d x(b-a),\tag{1}$$ y escribimos $$\d f_a=f'(a)\d x$$ que es la fórmula (1) escrito por lineal de las formas. De hecho, la forma lineal $\d f_a$ está definido por $$\d f_a(\epsilon)=f'(a)\d x(\epsilon)=f'(a)\epsilon.$$

En la física a menudo hace que la confusión entre el $\d x$ (de la forma lineal) y $\epsilon$ (el argumento de $\d x$). Espero que entiendas por qué cuando se mira en la última ecuación.

NOTA. Esto puede parecer bastante inútil, pero en la dimensión $n>1$ esto se vuelve más interesante. Usted ha hecho $$ \def\vec#1{\boldsymbol{#1}} \def\der#1#2{\frac{\partial #2}{\parcial #1}} \d f_{\vec un}=\nabla f(\vec a)\cdot\d\vec r=\begin{pmatrix}\der {x_1}{f(\vec a)}\\\vdots\\\der {x_n}{f(\vec a)}\end{pmatrix}\cdot \begin{pmatrix}\d x_1\\\vdots\\\d x_n\end{pmatrix}$$ que se traduce, por $\vec\epsilon=(\epsilon_1,\dots,\,\epsilon_k)\in\R^n$, $$ \d f_{\vec a}(\vec\epsilon)=\sum_{k=1}^n \der{x_k}{f(\vec a)}\d x_k(\vec\epsilon)=\sum_{k=1}^n\der{x_k}{f(\vec a)}\epsilon_k,$$ porque $\d x_k(\vec\epsilon)=\epsilon_k$ ($\d x_k$ es el $k^{\rm th}$ coordenada).

4voto

Tobias Puntos 1312

Como se puede ver a partir de la variedad de respuestas hay muchas posibilidades para interpretar los diferenciales matemáticamente exacta.

Una sencilla interpretación es como las coordenadas de los vectores tangenciales.

Considere la posibilidad de una ecuación $$ z = f(x,y) $$ describiendo una superficie curva en el espacio tridimensional ($z$ es la altura).

Entonces la ecuación $$ dz = \frac{\partial}{\partial x} f(x,y) \cdot dx + \frac{\partial}{\partial y} f(x,y) \cdot dy $$ describe los puntos de $(\bar x,\bar y,\bar z)=(x+dx,y+dy,z+dz)$ del plano tangencial en el punto de $(x,y,z)$ en la superficie. Esta ecuación es a menudo llamada la ecuación de la tangente.

Si usted tiene algún punto específico de la $(x,y,z)$ dada por los valores de las coordenadas de números y quisiera tener también un punto específico en el plano tangente acaba de poner números para $dx$, $dy$ y $dz$. Por lo tanto, los diferenciales pueden representar números. ¿Por qué no.

Hasta ahora tan bueno. Ahora, ¿por qué los números de ser pequeño? Suponemos que la superficie es lisa en el punto de $(x,y,z)$, lo que significa que $f$ debe ser continuamente diferenciable allí. Entonces $$ \frac{z+dz - f(x+dx,y+dy)}{|(dx,dy)|}\rightarrow 0 \quad\text{ para } |(dx,dy)|\rightarrow 0 $$ donde $dz$ cumple la anterior ecuación de la tangente. Aquí $|(dx,dy)|=\sqrt{dx^2 + dy^2}$ denota la norma Euclidiana.

La división por $|(dx,dy)|$ nos permite mirar a la escala de la imagen de la superficie alrededor del punto de $(x,y,z)$. Para mantener los ángulos como se nos de la escala de la imagen de manera uniforme en todas las direcciones. La imagen es siempre la escala tal que la perturbación $(dx,dy)$ desde el punto de $(x,y,z)$ está en el orden de magnitud de 1. Incluso en este escalado de imagen a la altura de la $z+dz$ de los perturbados punto de $(x+dx,y+dy,z+dz)$ sobre el plano tangencial que se adapta mejor a la correspondiente altura de $f(x+dx,y+dy)$ sobre la superficie curva.

$\sum$: El plano tangente con las coordenadas locales $dx$, $dy$ y $dz$ se adapta mejor a la superficie curva de la más pequeña de la disturbations $dx,dy,dz$.


Para aclarar las cosas, veamos un ejemplo. Deje que la superficie curva se $$ z=x^2-y. $$ Elegimos el punto específico con $x=1$ $y=2$ rendimiento $z=1^2-2 = -1$. La ecuación de la tangente es $$ dz = 2x\cdot dx - dy, $$ y en nuestro punto específico $$ dz = 2 dx - dy. $$ Para tener un punto específico en el plano tangente vamos a considerar los diferenciales $dx=\frac14$ $dy=1$ rendimiento $$ dz = 2\cdot\frac14 - 1 = -\frac12. $$

La ubicación de este punto sobre el plano tangente en 3d en el espacio $(x+dx,y+dy,z+dy)=\left(1+\frac14,2+1,-1-\frac12\right)=\left(\frac54,3,-\frac32\right)$.

En el mismo $x$ - $y$- coordenadas obtenemos en la superficie curva de la altura de la $z'$ con $$ z' = f(x+dx,y+dy) = f\left(\frac54,3\right) = \left(\frac54\right)^2 - 3 = -\frac{23}{16} = -1.4375. $$ Es un poco fuera de la altura de la $z+dz=-1.5$ de los puntos correspondientes en el plano tangente.


Incluso si yo aquí se presenta un ejemplo numérico en la práctica las diferencias son más a menudo se utiliza como variables para determinar las relaciones entre los diferenciales (con su interpretación como la tangente de coordenadas).

En el contexto de la tangente coordina el diferencial cociente $\frac{dy}{dx}=f'(x)$ es la proporción de las coordenadas $dx$ $dy$ de la tangente a la gráfica de $f$$x$.

Mientras evitar la división por cero puede dividir a través de un diferencial de $dx$ (como la tangente de coordenadas).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X