31 votos

¿Por qué se considera que $(\mathrm d x)^2=0$ ?

¿Por qué está bien considerar que $(\mathrm d x)^n=0$ para cualquier n mayor que $1$ ? Puedo entender que $\mathrm d x$ es infinitesimalmente pequeño ( pero mayor que $0$ ) y, por tanto, su cuadrado o cubo debe ser aproximadamente igual a $0$ no exactamente $0$ .

Pero si esto es así, ¿cómo podemos esperar que los resultados obtenidos del cálculo sean exacto y no sólo aproximada ( como la pendiente o el área bajo una curva )?

También he notado algunas anomalías, como $\sqrt{ (\mathrm d x)^2 + (\mathrm d y)^2 }$ es $0$ mais $\mathrm d x\sqrt{1+ (\mathrm d y/\mathrm d x)^2 }$ no es $0$ cuando estas dos cosas son aparentemente lo mismo . Además, podemos afirmar que

$$(\mathrm d x)^2=(\mathrm d x)^3=(\mathrm d x)^4 = \cdots = 0$$

lo que es bastante difícil de creer.

¿Puede ayudarme a entender la lógica de estas cosas?

20voto

Autores clásicos como Pierre de Fermat y Gottfried Wilhelm Leibniz descartó los términos de orden superior en infinitesimal $E$ (en el caso de Fermat) o $dx$ (en el caso de Leibniz) comprendiendo perfectamente que los términos son pas a cero, sino desechado . En otras palabras, utilizaron una noción generalizada de relación de igualdad hasta un término despreciable.

Fermat introdujo específicamente un término que se traduce al español como adecuación para referirse a una relación más general. Leibniz es bastante específico en sus escritos (por ejemplo, en su respuesta publicada a Nieuwentijt en 1695) de que está trabajando con tal relación generalizada de igualdad.

En las teorías infinitesimales modernas, este tipo de relación se formaliza en términos de lo que se conoce como la función de pieza estándar (o sombra ). Por lo tanto, el cálculo de la relación $\frac{\Delta y}{\Delta x}$ para $y=x^2$ no dará los resultados esperados $2x$ sino la cantidad infinitamente próxima $2x+\Delta x$ donde $\Delta x$ es infinitesimal. Para calcular la derivada en un punto real $x=c$ se toma la parte estándar de $2c+\Delta x$ para obtener $2c$ la respuesta esperada.

Así, al expandir la expresión $(x+dx)^2=x^2+2dx+dx^2$ uno lo hace pas fijar el plazo $dx^2$ igual a cero, aunque superficialmente pueda parecer que se está haciendo exactamente eso. Hay que ver el panorama más amplio cuando estas expresiones se ponen en relación unos a otros para entender lo que está pasando.

Una perspectiva más amplia de esta evolución puede encontrarse en este artículo reciente . Para más artículos sobre este tema, véase esta página .

15voto

Anthony Shaw Puntos 858

No es el cuadrado de $\mathrm{d}x$ es decir $0$ . Es $\mathrm{d}x\land\mathrm{d}x$ que es cero.

Esto entra en juego en la forma diferencial y en los cambios de variables. Supongamos que $u=x+y$ y $v=x-y$ . Entonces $$ \begin{align} \iint f\,\mathrm{d}u\,\mathrm{d}v &=\iint f\,\mathrm{d}(x+y)\,\mathrm{d}(x-y)\\ &=\iint f\,\mathrm{d}x\,\mathrm{d}x+\iint f\,\mathrm{d}x\,\mathrm{d}y-\iint f\,\mathrm{d}y\,\mathrm{d}x-\iint f\,\mathrm{d}y\,\mathrm{d}y\\ &=\iint f\,\mathrm{d}x\,\mathrm{d}y-\iint f\,\mathrm{d}y\,\mathrm{d}x\tag{1} \end{align} $$ ¿Por qué $\iint f\,\mathrm{d}x\,\mathrm{d}x=\iint f\,\mathrm{d}y\,\mathrm{d}y=0$ ? Bueno, dentro de la integral exterior, $x$ se supone que se mantiene constante, por lo que el interior $\mathrm{d}x$ desaparecerá. Lo mismo ocurre con el doble $y$ integral.

Otra consecuencia de esto se desprende de $$ \begin{align} 0 &=\iint f\,\mathrm{d}u\,\mathrm{d}u\\ &=\iint f\,\mathrm{d}(x+y)\,\mathrm{d}(x+y)\\ &=\iint f\,\mathrm{d}x\,\mathrm{d}x+\iint f\,\mathrm{d}x\,\mathrm{d}y+\iint f\,\mathrm{d}y\,\mathrm{d}x+\iint f\,\mathrm{d}y\,\mathrm{d}y\\ &=\iint f\,\mathrm{d}x\,\mathrm{d}y+\iint f\,\mathrm{d}y\,\mathrm{d}x\tag{2} \end{align} $$ Eso es, $\mathrm{d}y\land\mathrm{d}x=-\mathrm{d}x\land\mathrm{d}y$ . Así, la integral en $(1)$ es igual a $$ 2\iint f\,\mathrm{d}x\,\mathrm{d}y\tag{3} $$


Nota

Es pas el caso de que $\sqrt{\mathrm{d}x^2+\mathrm{d}y^2}=0$ . Es lo mismo que $\mathrm{d}x\sqrt{1+\left(\frac{\mathrm{d}y}{\mathrm{d}x}\right)^2}$ en cualquier contexto, ambos tienen sentido.

14voto

Andy Puntos 21

En el análisis estándar no hay infinitesimales. $dx$ no es más que un elemento sintáctico utilizado para expresar $\frac{df}{dx}$ y $\int f(x) dx$ y nada más. En su lugar, todo se define en términos de límites sobre números reales. En particular, los límites se definen en términos de límites sobre números reales, con lo que se obtienen derivadas e integrales. En esta configuración, una situación en la que se vería $dx^2$ si estuvieras usando infinitesimales podrías estar diferenciando $x^2$ . En este caso se encuentra $\frac{(x+h)^2-x^2}{h}=2x+h$ . Este $h$ no es cero... pero si $x$ no es cero y $h$ va a cero entonces es mucho menor que el $2x$ al que se añade. Es decir, el término de orden superior de $(x+h)^2$ es $x^2$ la corrección de primer orden es $2xh$ .

Gran parte del cálculo se ocupa exclusivamente de los términos de primer orden y de las correcciones de primer orden. Gran parte del resto se limita a las correcciones de segundo orden. A pesar de ello, si $h^k$ por sí mismo para algún número entero grande $k$ En el lenguaje infinitesimal, no pensarías en él como si fuera cero; sólo lo descuidas cuando se suma a algo mucho mayor que él. Por lo tanto, en el lenguaje infinitesimal no deberías pensar realmente en $dx^2$ como si fuera cero, sino mucho menor que $dx$ que $dx+dx^2$ puede tratarse como $dx$ . (En particular, en circunstancias normales $\sqrt{(dx)^2+(dy)^2}$ puede interpretarse como $dx \sqrt{1+(dy/dx)^2}$ .)

Este lenguaje infinitesimal puede formalizarse, dando lugar a teorías que se denominan análisis no estándar. Existen básicamente dos formas de hacerlo. Una es el análisis infinitesimal suave, que en realidad utiliza infinitesimales nilpotentes, es decir, números "no nulos" con alguna potencia de ellos que es cero. Por ejemplo, para un infinitesimal nilsquare $dx$ tienes $f(x+dx)=f(x)+f'(x)dx$ como igualdad exacta en SIA.

La SIA es una teoría un tanto extraña, al menos por dos razones. En primer lugar, se requiere cierta delicadeza con la lógica para que funcione sin contradicciones. No se puede definir SIA en la lógica clásica, es una teoría inconsistente allí, porque (como usted insinuó) se puede utilizar el medio excluido y los axiomas de campo para demostrar que $(dx)^2=0$ implica $dx=0$ . La lógica intuicionista elude esta cuestión. En segundo lugar, la SIA, como su nombre indica, describe un "universo suave": todas las funciones que lo componen son infinitamente diferenciables. El análisis estándar trata con funciones menos regulares de forma bastante rutinaria.

La otra forma principal de formalizar los infinitesimales es el análisis hiperreal, que sirve para describir exactamente las mismas cosas que el análisis estándar, en cierto sentido preciso y muy fuerte. El análisis hiperreal tiene infinitesimales, pero no son nilpotentes. En cambio, el análisis hiperreal sustituye los límites del análisis estándar por una operación de "parte estándar", que toma un número con una parte real ordinaria y una parte infinitesimal y "descarta" la parte infinitesimal.

Sólo los menciono para que sepas que hay algún poder más allá de la mera intuición en el uso de los infinitesimales. No obstante, te animo encarecidamente a que aprendas el significado de todo en el marco estándar.

Revisando en base al comentario de la recompensa: en primer lugar, no se debe ver $\sqrt{dx^2+dy^2}$ (intuitivamente la longitud de un segmento de línea infinitesimal) como cero. Es exactamente lo mismo que $|dx| \sqrt{1+(dy/dx)^2}$ . (Es posible que necesitemos el valor absoluto porque $x$ puede subir o bajar a lo largo del camino). Una forma más general de manejar esto sería parametrizar la curva en términos de una variable adicional $t$ de modo que $\sqrt{dx^2+dy^2}=dt \sqrt{(dx/dt)^2 + (dy/dt)^2}$ . Ahora $t$ sólo sube (por nuestra elección), por lo que no es necesario un valor absoluto.

En cuanto a la escritura $dx+dx^2 \approx dx$ depende del contexto. En el caso de los derivados pas para escribir exactamente la función, se trata de una aproximación lineal. Así, por ejemplo, cuando escribo $(x+h)^2 \approx x^2+2xh$ Lo hago porque no quiero prestar atención a términos de orden superior a $h$ porque esos dos primeros términos (los más grandes, si $h$ es lo suficientemente pequeño) son suficientes para cualquier propósito que tenga.

Por otro lado, una filosofía básica en cálculo y análisis (estándar) es que se puede demostrar que dos cosas son igual demostrando que son arbitrariamente juntos . Así que siguiendo con tu ejemplo, cuando amplíes una prueba que $\int_0^\pi \sin(x) dx = 2$ se puede demostrar que existe una suma inferior para $\int_0^\pi \sin(x) dx$ que es como mínimo $2-\epsilon$ y una suma superior que es como máximo $2+\epsilon$ para cada $\epsilon>0$ . La partición depende de $\epsilon$ y esa dependencia es exactamente donde se oculta la operación "límite". (En la práctica no hacemos esto, sólo usamos el FTC, pero el FTC se demuestra de esta manera).

10voto

Jesse Madnick Puntos 13166

Este post pretende ser un comentario extendido más que una respuesta.

Ian señala que hay tres maneras de interpretar el símbolo " $dx$ ":

  1. análisis infinitesimal;
  2. análisis hiperrealista;
  3. formas diferenciales.

Los dos primeros enfoques son algo menos estándar, creo, y de hecho, sé muy poco sobre cualquiera de ellos. Por ello, me gustaría comentar la cuestión desde la perspectiva de (3) las formas diferenciales.


En la teoría de formas diferenciales , deben distinguirse los cinco objetos siguientes: $$dx, \ \ d(x^2), \ \ (dx)^2, \ \ \ dx \wedge dx, \ \ d(dx).$$

  • El objeto $dx$ es un "diferencial $1$ -forma". Es pas cero.
  • El objeto $d(x^2)$ es igual a $2x\,dx$ que también es un "diferencial $1$ -forma". También es pas cero.
  • El objeto $(dx)^2$ es una "forma cuadrática suave". Es pas cero. Aquí, el cuadrado es una operación llamada " producto simétrico ."
  • El objeto $dx \wedge dx$ es un "diferencial $2$ -forma". En es igual a cero. En $\wedge$ es una operación denominada " producto de cuña ." El producto cuña tiene la curiosa propiedad de que $dx \wedge dx = 0$ mientras que $dx \wedge dy = -dy \wedge dx$ no es cero.
  • El objeto $d(dx)$ es un "diferencial $2$ -forma". En es igual a cero. De hecho, el símbolo $d$ se denomina " derivada exterior y tiene la curiosa propiedad de que $d(df) = 0$ para cualquier función $f$ .

Aunque esto no responde a la pregunta propiamente dicho Espero que esta aclaración sea útil para la comprensión.

2voto

Intentemos entender las cosas a nivel intuitivo con la ayuda de un problema de juguete. Si buscas matemáticas avanzadas, por favor sáltate esta respuesta.

Supongamos que una clase de niños va de un lugar A a B. Al principio del trayecto, el profesor dice: "¡Hola, clase! Hay un pequeño problema. El velocímetro del autobús no funciona. Necesitamos calcular la velocidad del autobús durante algún tiempo. ¿Podemos hacerlo? Puedo deciros que durante los próximos segundos, la distancia recorrida por el autobús $x = t^2$ donde $x$ está en metros y $t$ está en segundos. En concreto, quiero que averigües la velocidad a la que $t=2$ y $t=3$ segundos".

La clase, que no tiene nociones de cálculo, se queda perpleja al principio. Pero poco a poco, intentan descifrar algunas aproximaciones.

Siddhartha: Si queremos encontrar la velocidad a $t=2$ segundos, podemos echar un vistazo a la distancia recorrida entre $t=1$ y $t=2$ . Serían 3 metros, por lo que podemos decir que la velocidad es superior a 3 m/s.

Akanksha: Buen punto. Pero en lugar del segundo anterior, podemos echar un vistazo al siguiente segundo. En el siguiente 1 segundo, el autobús recorre 5 m. Por lo tanto, la velocidad es inferior a 5 m/s. De hecho, podemos decir que la velocidad está entre 3m / s y 5m / s en $t=2$ segundos.

Harsh: Pero, ¿por qué tomamos como unidad de tiempo 1 segundo? Si reducimos el intervalo de tiempo, obtendremos una mejor aproximación, ¿no?

Siddhartha: ¡Encantador! Hagámoslo con un intervalo de tiempo de 1/2 segundo. Entonces. (Empieza a poner números en un papel y a hacer sumas y restas) Vaya, entonces, con un intervalo de tiempo de 1/2 segundo, podemos decir que nuestra velocidad está entre 3,5 y 4,5 m/s

Akanksha: Y podemos repetir este proceso para tiempos más pequeños también. De hecho, tengo la sensación de que si tomamos brecha de tiempo para ser 1/4 segundos, obtendremos velocidad entre 3,75 y 4,25 segundos.

Profesor: ¿Por qué no lo compruebas?

Tras unos segundos, Harsh verifica la afirmación. En este punto, el profesor les pide que busquen una prueba de que esto es válido para el caso general $t$ y $\Delta t$

Entonces, los alumnos hacen el cálculo $v = ((t + \Delta t)^2 -t^2)/ \Delta t = (2t\Delta t + (\Delta t)2)/ \Delta t = 2t + \Delta t$

Por lo tanto, si tomamos la brecha de tiempo para ser $\Delta t$ podemos decir que nuestra velocidad se encuentra entre, $2t -\Delta t$ y $2t + \Delta t$ . Por lo tanto, si ponemos nuestro $\Delta t$ sea muy pequeña (aproximadamente cero), obtenemos nuestra velocidad como $2t$ . Podemos llamar a esto nuestra velocidad en este momento.

Profesora: ¡Excelente! El término técnico para esto es velocidad instantánea. ¿Puedes repetir el mismo procedimiento si te diera $x = t^3$ ¿en su lugar?

Estudiantes (todos emocionados): ¡Sí, claro!

$v = ((t + \Delta t)^3 -t^3)/ \Delta t = (3(\Delta t)t^2 + 3t(\Delta t)^2 + (\Delta t)^3))/ \Delta t = 3t^2 + 3t\Delta t + (\Delta t)^2$

Siddhartha: Maestro, estoy recibiendo esta expresion. ¿Qué debo hacer ahora?

Profesor: Trate de $t=2$ . ¿Ves lo que pasa?

Siddhartha: Si pongo $\Delta t$ sea muy pequeño, digamos 0,0001, obtengo valores muy cercanos a 12.

Profesora: Encantador. ¿Qué tal $t=3$ ? General $t$ ?

Siddhartha: Siempre puedo poner $\Delta t$ ser muy muy pequeño. Por lo tanto, el único término que queda es $3t^2$ .

Profesor (después de esperar a que los demás se pongan al día): ¡Excelente! Ahora, ¿notan que en efecto, cuando estamos expandiendo $(t + \Delta t)^n$ podemos ignorar para nuestros propósitos todas las potencias mayores que 2. Así, podríamos haber expandido $(t + \Delta t)^2$ como $(t^2 + 2t\Delta t)$ y $(t + \Delta t)^3$ como $(t^3 + 3t^2\Delta t)$ y seguía obteniendo la misma respuesta.

Los alumnos guardan silencio durante algún tiempo. Al cabo de un rato, un alumno rompe el silencio.

Akanksha: Es porque, en la división tenemos el poder de $\Delta t$ como 1. Por lo tanto, cualquier término de mayor potencia se volvería muy pequeño, cuando hacemos $\Delta t$ pequeño. De hecho, si tomamos $\Delta t$ ser casi cero, los poderes superiores serían todos casi cero, ya que si $\Delta t = 0.0001$ sus poderes superiores serían aún más pequeños, de hecho, mucho más pequeños.

Profesora: Excelente pensamiento Akanksha. De hecho, todos habéis hecho un gran trabajo. Habéis descubierto los fundamentos del cálculo por vosotros mismos. Permitidme que complete un poco la nomenclatura para que podamos compartir con los demás nuestra línea de pensamiento.

Cuando decimos que $\Delta t$ es casi cero, lo escribimos como $\lim_{\Delta t \rightarrow 0}$ . Dado que se utiliza muchas veces, ahorramos mucho esfuerzo escribiendo $dt$ en lugar de escribir $\Delta t$ en $\lim_{\Delta t \rightarrow 0}$ .

Entonces, cuando, el denominador tiene la potencia de $dt$ en uno, podemos poner con seguridad $dt^2$ , $dt^3 \ldots$ como 0. Sin embargo, si el denominador tiene mayor potencia de $dt$ Entonces, obviamente no podemos hacerlo.

¿Pueden entender esto, mis queridos alumnos?

Harsh: Entonces, ¿estás diciendo que podemos ignorar todos los poderes de $dt$ mayor que la potencia más baja del denominador.

Profesora: Sí.

Duro: ¿Sería válido también para las potencias no integrales?

Profesora: ¿Usted dice?

Harsh: Debería, ya que $0.0001^{3/2}$ sigue siendo inferior a 0,0001, que consideramos casi cero.

Profesora: ¡Encantador!


En nuestro caso, no podemos decir que $\sqrt{(dx)^2 + (dy)^2} = 0$ sin más contexto. En concreto, el contexto necesario es si podemos o no ignorar el cambio infinitesimal en $x$ . Tampoco podemos decir que $dx \sqrt{1 + (dy/dx)^2}$ no es cero por la misma razón.

De hecho, los dos ( $dx \sqrt{1 + (dy/dx)^2}$ y $\sqrt{(dx)^2 + (dy)^2}$ ) son idénticos. Si uno es cero, el otro tiene que serlo.

Lo que podemos decir es $\sqrt{1 + (dy/dx)^2}$ es distinto de cero. Porque es raíz cuadrada de (1 + cuadrado de algo), por tanto, raíz cuadrada de (algo siempre positivo).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X