Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

22 votos

Si d/dx es un operador, ¿sobre qué opera?

Si ddx es un operador diferencial, ¿cuáles son sus entradas? Si la respuesta es "funciones (diferenciables)" (es decir, conjuntos de pares ordenados independientes de la variable), tenemos dificultades para distinguir entre ddx y ddt que en la práctica tienen significados diferentes. Si la respuesta es " funciones (diferenciables) de x "¿Qué significa eso? Suena como un peculiar híbrido de objeto matemático (función) con notación matemática (variable x ).

En ddx tienen una interpretación como operador, distinta de ddt y coherente con su uso en Cálculo de primer curso?

50voto

thedeeno Puntos 12553

(Del post en mi blog :)

A mi modo de ver, se trata de una pregunta seria, y no me satisfacen realmente las demás respuestas y comentarios, que parecen responder a una pregunta diferente de la que me parece interesante aquí.

El problema es el siguiente. Queremos considerar ddx como operador en los sentidos abstractos mencionados por varios de los otros comentarios y respuestas. En la situación más elemental, opera sobre una función de una sola variable real, devolviendo otra función de este tipo, la derivada. Y lo mismo para ddt .

El problema es que, descritos así, los operadores ddx y ddt parecen ser los mismo operador, es decir, el operador que lleva una función a su derivada, pero sin embargo parece que no podemos sustituir libremente estos símbolos entre sí. en las expresiones formales. Por ejemplo, si un profesor escribiera ddtx3=3x2 un estudiante podría objetar: "¿no querrás decir ddx ?" y el instructor probablemente respondería: "Oh, sí, perdone, quería decir ddxx3=3x2 . La otra expresión tendría un significado diferente".

Pero si son el mismo operador, ¿por qué las dos expresiones no tienen el mismo significado? ¿Por qué no podemos sustituir libremente este operador por otros nombres y obtener el mismo resultado? ¿Qué ocurre aquí con la lógica de referencia?

La situación es que el operador ddx parece tener sentido sólo cuando se aplica a funciones cuya variable independiente se describe mediante el símbolo "x". Pero esto choca con la idea de que lo que la función es en el fondo no tiene nada que ver con la forma en que la representamos, con los símbolos particulares que podamos utilizar para expresar de qué función se trata. Es decir, la función es el objeto abstracto (ya se interprete en la teoría de conjuntos o en la teoría de categorías o en cualquier teoría fundacional), y no está conectada de ninguna manera íntima con el símbolo " x ". Seguramente las funciones xx3 y tt3 con el mismo dominio y codominio, son simplemente formas diferentes de describir exactamente la misma función. Entonces, ¿por qué parece que no podemos sustituirlas entre sí en las expresiones formales?

La respuesta es que el uso sintáctico de ddx en una expresión formal implica una especie de vinculación de la variable x .

Considere la cuestión de colisión de variables ligadas en lógica de primer orden: si φ(x) es la afirmación de que x no es maximal con respecto a < expresado por y x<y entonces φ(y) la afirmación de que y no es maximal, no se describe correctamente como la afirmación y y<y que es lo que se obtendría simplemente sustituyendo la aparición de x en φ(x) con el símbolo y . Para el significado pretendido, no podemos simplemente reemplazar sintácticamente la ocurrencia de x con el símbolo y si ese suceso de x entra en el ámbito de un cuantificador.

Del mismo modo, aunque las funciones xx3 y tt3 son iguales como funciones de una variable real, no podemos simplemente sustituir sintácticamente la expresión x3 para t3 en ddtt3 para obtener ddtx3 . Incluso se podría tomar esta última como una especie de expresión mal formada, sin más explicación de cómo x3 en función de t .

Por lo tanto, la expresión ddx provoca la vinculación de la variable x al igual que un cuantificador, lo que impide la sustitución libre del mismo modo que la colisión. Pero en este caso no ocurre lo mismo que con x es una variable ligada en 10x3 dx ya que x permanece libre en ddxx3 pero diríamos que 10x3 dx tiene el mismo significado que 10y3 dy .

Por supuesto, la cuestión se evapora si se utiliza una notación, como el λ -que insiste en que uno sea completamente explícito sobre qué variables sintácticas deben considerarse como variables independientes de un término funcional, como en λx.x3 es decir, la función de la variable x con valor x3 . Y así es como me tomo varias de las otras respuestas a la pregunta, a saber, que el uso del operador ddx indica que se ha indicado previamente cuál de los argumentos de la función dada debe considerarse como x y es con respecto a este argumento que se está diferenciando. En la práctica, esto casi siempre queda claro sin mucho comentario. Por ejemplo, nuestro uso de x y y parece manejarse muy bien en situaciones complejas, a veces con decenas de variables dando vueltas, sin adoptar el oneroso formalismo del λ -cálculo, incluso si ese formalismo es lo que estas soluciones son esencialmente en realidad.

Mientras tanto, es fácil hacer ejemplos en los que hay que ser muy específico sobre qué variables son la variable independiente y cuáles no, como menciona Todd en su comentario a la respuesta de David. Por ejemplo, casos como

ddxx0(t2+x3)dtddtxt(t2+x3)dt

se aclaran seguramente para los estudiantes mediante un debate sobre el uso de variables en expresiones formales y, más concretamente, sobre la cuestión de las variables ligadas y libres.

35voto

steevc Puntos 211

No estoy seguro de por qué esta pregunta ha vuelto a la primera página, pero sólo quería añadir que la situación parece aclararse generalizando temporalmente a dimensiones superiores y a espacios curvos, es decir, adoptando una perspectiva de geometría diferencial.

En primer lugar, un breve recordatorio del concepto de base dual en álgebra lineal: si se tiene una n -espacio vectorial dimensional V (digamos sobre los reales R en aras de la discusión), y uno tiene una base e1,,en de ella, entonces hay una base dual única e1,,en del espacio dual V=Hom(V,R) tal que ei(ej)=δji para todos i,j=1,,n ( δji siendo el delta de Kronecker, y donde estoy tratando de elegir subíndices y superíndices de acuerdo con Notación de Einstein ). Vale la pena señalar que mientras que cada elemento de base dual ei es "dual" con su homólogo ei en el sentido de que ei(ei)=1 , ei no está determinada únicamente por ei (excepto en el caso unidimensional n=1 ); también hay que conocer todos los demás vectores de la base además de ei para calcular ei .

Con un espíritu similar, siempre que se tenga una n -de una variedad lisa tridimensional M y (localmente) se tiene n funciones de coordenadas suaves x1,,xn:MR en este colector, cuyo diferenciales dx1,,dxn forman una base del espacio cotangente en cada punto p del colector M entonces (al menos localmente) existe una única "base dual" de derivaciones 1,,n en C(M) con la propiedad ixj=δji para i,j=1,,n . (Por cierto, demostrar esta afirmación es un ejercicio excelente para alguien que realmente quiera entender los fundamentos modernos de la geometría diferencial).

Ahora, tradicionalmente, la derivación i se denomina xi . Pero la notación es un poco engañosa, ya que sugiere que xi sólo depende del ith función de coordenadas xi cuando en realidad depende de toda la base x1,,xn de funciones de coordenadas. Esto se puede solucionar utilizando una notación más complicada, por ejemplo xi|x1,,xi1,xi+1,,xn que informalmente significa "diferenciar con respecto a xi mientras se mantienen las otras coordenadas x1,,xi1,,xi+1,,xn fijo". Este tipo de notación se utiliza, por ejemplo, en termodinámica. Por supuesto, las cosas son mucho más sencillas en el entorno unidimensional n=1 ; aquí, cualquier función de coordenadas x (con diferencial dx que no desaparece en ninguna parte) da lugar a una derivación única ddx tal que ddxx=1 .

Con esta perspectiva, podemos responder por fin a la pregunta original. El símbolo x se refiere a una función de coordenadas x:MR en el dominio unidimensional M en la que se está trabajando. Normalmente, uno "simplifica" las cosas identificando M con R (o tal vez un subconjunto del mismo, como un intervalo [a,b] ) y ajuste x sea la función de identidad x(p)=p pero aquí adoptaremos en su lugar una perspectiva geométrica más diferencial y nos negaremos a hacer esta identificación. Las entradas de ddx son funciones suaves (o al menos diferenciables) f en el dominio unidimensional M . De nuevo, uno suele "simplificar" las cosas pensando en f como funciones de la función de coordenadas x pero en realidad son funciones de la variable de posición p Esta distinción entre x y p suele quedar oscurecida debido a la "simplificación" antes mencionada x(p)=p lo cual es conveniente para el cálculo pero causa confusión conceptual al confundir el mapa con el territorio .

Así, por ejemplo, la identidad ddxx2=2x debe interpretarse en realidad como ddx(px(p)2)=(p2x(p)), donde px(p)2 denota la función que toma la variable de posición p a la cantidad x(p)2 y lo mismo para p2x(p) .

Si además se tuviera otra coordenada t:MR en el mismo dominio M entonces se tendría otro diferencial ddt en M que está relacionado con el diferencial original ddx por la regla de la cadena habitual ddtf=(ddtx)(ddxf). De nuevo, para mayor claridad conceptual, t,x,f:MR deben considerarse aquí como funciones de una variable de posición pM en lugar de considerarlos funciones unos de otros.

12voto

dbr Puntos 66401

La respuesta aceptada es buena en el sentido de que llama la atención sobre las sutilezas de la cuestión, pero por lo que veo no resuelve realmente el asunto.

Joel se cuida de hablar de un tipo de encuadernación de x por ddx pero al mismo tiempo menciona que x permanece libre en ddxx3 . Entonces, ¿está libre o atado?

No puede estar ligada en el sentido tradicional (y Joel lo dice), de lo contrario se nos permitiría renombrar las variables ligadas ( α -convertir) y escribir ddxx2=ddtt2, que todo el mundo desde Leibniz simplificaría a 2x=2t. Probablemente sea una mala idea tener un mecanismo que nos permita concluir que dos variables libres cualesquiera son iguales.

Por otra parte x no puede ser libre en el sentido tradicional, ya que si sustituimos digamos 5 para x conseguiríamos dd552. La mayoría de la gente consideraría que esto no tiene sentido. Incluso si no considerarlo sin sentido, no veo cómo se podría llegar desde ahí al resultado esperado de 10 . (Ciertamente, si se permite sustituir 5 para x en ddxx2 también permitiría sustituir 25 para 52 en dd552 para reescribirlo como dd525. Pero la misma expresión resulta si sustituimos 5 para x en ddx(20+x) siendo ahora el resultado esperado 1).

Por tanto, concluimos que x no está vinculada ni libre en ddxx2 . Pero, ¿qué tipo de encuadernación es entonces?

Desde una perspectiva moderna es tentador decir que ddxx2 es "azúcar sintáctico" para (λx.x2)(x) donde f denota la derivada de un mapa f:RR y λx.x2 es la notación del cálculo lambda para el mapa xx2 . Pero la expresión (λx.x2)(x) tiene un x (en el segundo paréntesis) y un límite x (dentro del λx.x2 ), aunque no está claro qué x en dx2dx está libre/ligado. Así que si realmente queremos interpretar dx2dx como azúcar sintáctico para (λx.x2)(x) parece que falta una prueba de que esta notación es correcta (lo que me recuerda el artículo de Mike Shulman question ). También podríamos concluir lo que sugirió Andrej Bauer en otro lugar que tal vez df(x)dx es una notación rota que deberíamos dejar de enseñar.

En su lugar, argumentaré que hay es una forma coherente de dar sentido a la notación dydx . Ya se sugirió en su pregunta: interpretar ddx como actuando sobre "funciones de x ". Usted pregunta con razón qué funciones de x son. He aquí una manera de responder a eso: interpretar las variables x , y del cálculo como mapas diferenciables de una variedad M (el espacio de estado) a R . Llama a una de estas variables y en función de x si existe f:RR tal que y=fx . Se puede demostrar fácilmente que si y es función de x en este sentido, entonces existe un único z:MR tal que dy=zdx donde dx,dy son formas diferenciales en el sentido de la geometría diferencial moderna. (De hecho z=fx y solía denominarse coeficiente diferencial de dy wrt dx ). Denotemos este único z con dydx .

Puede que no estés muy contento con el colector M que aparece aquí, ya que nunca apareció explícitamente en el antiguo cálculo. A mí tampoco me gusta mucho, por eso he preguntado esta pregunta y me he enterado ahora de que ya habías pedido un pregunta muy similar varios años antes. (Las respuestas que recibió allí lamentablemente no me satisfacen).

2voto

Xavier Nodet Puntos 2498

Edición: obviamente, algunas personas no se dieron cuenta de que esta respuesta era irónica. Además, yo leí la pregunta de forma diferente a los demás, dada su ambigüedad, y no me molesté en la última parte de la pregunta (posiblemente la más crucial).

La esencia de mi respuesta era una ampliación del comentario de Sam Gunningham, a saber, que el operador " ddx "es en realidad la restricción de un functor sobre la categoría de los manifolds lisos puntiformes y los mapas puntiformes, a la subcategoría formada por los espacios vectoriales unidimensionales sobre R . La idea de la independencia de las coordenadas se recoge en el principio de equivalencia (cuya violación solía ser llamada en broma "maligna" por algunas personas), en el sentido de que las matemáticas no pueden distinguir entre variedades difeomórficas, y por tanto, llamemos como llamemos a este operador, ddx o ddt o lo que sea, todas son naturalmente isomorfas, y por tanto indistinguibles en el caso de 1 variable. Acepto la observación, expuesta en los comentarios, de que en el caso multivariable las cosas son más sutiles, y cedo a Respuesta de Golderstern .

Pero la gracia está en que la categoría de las variedades puede definirse de muchas formas distintas: a partir de conjuntos materiales, de conjuntos estructurales, mediante la geometría diferencial sintética o mediante las teorías de Fermat, por lo que sostengo que no hay una única respuesta a (mi lectura de la) pregunta.


Me parece que la declaración

"funciones (diferenciables)" (es decir, conjuntos de pares ordenados independientes de la variable)

muy peculiar. Una función diferenciable es una cierta flecha en la categoría de las variedades suaves, y aún mejor, es una flecha en la categoría donde los objetos son finito-dimensionales R -espacios vectoriales En (para todos n ) con la topología habitual. El functor del haz tangente toma una función suave f:EnEm y devuelve una función suave df:TEnTEm (el haz tangente de En es difeomorfo a E2n y, por tanto, también un espacio vectorial). Digamos que estamos en el caso n=1 . Podemos restringir esta función al espacio tangente de E1 en 0 y obtener una función suave EEm . Aquí no se han elegido coordenadas.

Pero, ¿cómo se ha llegado a esta categoría de colectores? me pregunto. Bueno, empecé con la categoría de conjuntos e hice lo de siempre. ¿Pero cómo surgió esta categoría de conjuntos? Bueno, la respuesta es breve, ETCS . La respuesta más larga es que la categoría de conjuntos (o mejor dicho, una categoría de conjuntos lo suficientemente fuerte como para formalizar todo el cálculo de pregrado y, de hecho, la mayor parte de las matemáticas) puede definirse en términos de una teoría de primer orden. (Aparte, si le molesta perderse las partes más duras de ZFC, utilice la teoría fundacional SEAR-C tampoco define las funciones como conjuntos de pares ordenados).

En ningún momento he definido una función como un conjunto de pares ordenados, y todo es independiente de la elección de las coordenadas.

Alternativamente, podemos decir que d/dx es una operación de la Teoría de Fermat de C -Anillos. En este sentido, las funciones suaves pueden verse como modelos para una teoría que está mucho más centrada que la teoría de conjuntos, y no hay flacidez, en el sentido de que esta teoría sólo habla de funciones suaves.

[Si estás haciendo preguntas que suponen df(t)/dt y df(x)/dx son de alguna manera distinguibles, y llevando definiciones fundacionales al cálculo básico, entonces espere respuestas que respondan con un nivel similar de descaro].

2voto

Tom Wadley Puntos 111

Repito (una variante de) mi comentario, aunque estoy de acuerdo en que es superficial y tiene poco valor de entretenimiento.

Mientras sólo consideremos funciones en una variable, sólo existe un operador diferencial D que puede denominarse ddx o ddt en función del contexto.

Si nos fijamos en una función compuesta fg puede introducir la notación/abreviatura x=g(t) , y=f(x) , entonces

  • ddxf o ddxy es sólo D(f) ,
  • y por ddtf o ddty quieres decir D(fg) .

Así que aquí tanto ddx y ddt tienen un significado, y el significado es diferente.

Cuando examinamos funciones en, digamos, dos variables (¿aparecen en primer curso de cálculo?), introducimos implícitamente un orden (arbitrario) de variables, digamos que x es la primera y t la segunda, y x es la derivada parcial con respecto a la primera variable. Esto tiene sentido incluso si tratas las funciones como conjuntos "agnósticos de variables" de pares ordenados. (Cosa que yo hago todo el tiempo, y no encuentro peculiar en absoluto. Los gustos difieren).

Por supuesto, el significado depende siempre del contexto. Si f es una función binaria, ddtf puede ser una notación variante de tf o puede entenderse que en realidad estamos ante una función unaria ˆf obtenido mediante la composición de f con alguna función t(x(t),y(t)) .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X