16 votos

La formalización de Esas Lecturas de la Notación de Leibniz, que no atraen a la Infinitesimals/Diferenciales

[descargo de responsabilidad: he estudiado mucho de lógica, pero nunca han sido buenos en el análisis, por lo que el ángulo estoy viniendo abajo]

en mi intento de encontrar una versión exacta de las "definiciones" generalmente se da cuando la primera introducción de la notación de leibniz, en única o multivariable cálculo o análisis, en la cual no hay apelación a los diferenciales o infinitesimals, he descubierto que estoy confundido acerca de un par de interellated de bajo nivel cuestiones en torno a la formalización y la notación, etc. No sé qué preguntas son las más básicas aquí, así que voy a pedirles ir a lo largo de explicar lo que yo pienso hacer entender acerca de la propuesta formal defintions de la especie en cuestión.

Estoy preocupado con el dy/dx de la notación y la 'y del/del x' notación de derivadas parciales, pero sólo el valor real del caso.

Desde que tengo la sospecha de que mi confusiones madre de uso-mención de confusiones, y la confusión de funciones, variables y sus valores, yo la uso, y asumir la familiaridad con la notación lambda, metavariables, y cuasi-cita a lo largo. Donde no se declara, ⌜λx.φ⌝ se refiere a la función en la más real de dominio sobre el que φ es un número real. Se supone que solo las definiciones de variables reales son buscados por debajo.

De todos modos, con las definiciones:

Estos artículos cortos por el autor de Thurston (los primeros cinco resultados) todos dan casi la misma definición formal de la notación de leibniz:

http://scholar.google.ca/scholar?hl=en&as_sdt=0,5&q=thurston+leibniz

mientras que los primeros resultados de esta búsqueda son por el autor de Harrison, y dar a cada uno de unas ligeras variantes en una definición diferente:

http://www.google.ca/search?q=%22leibniz+notation%22+%22lambda+term%22&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:en-GB:official&client=firefox-a

aquí está mi comprensión de sus definiciones:

HARRISON:

⌜dφ/dψ⌝ es una abreviación de ⌜D(λψ.φ)(ψ)⌝ es decir, "dy/dx" es sinónimo de "D(λx.y)(x)"

Esto significa que:

ψ debe ser una variable de la lógica subyacente (y tiene un libre y un obligado ocurrencia de aquí) y

φ debe ser una cadena de texto que ⌜∀x, φ = f(x)⌝ es el caso de la función f:S→R, donde S⊆R.

Q1. ¿alguien tiene una manera más simple de estado de la restricción en φ? Q1.1 ¿cuál es el nombre correcto para el tipo de cadena φ debe ser?

THURSTON: ⌜dφ/dψ⌝ es una abreviación de ⌜ψ'/φ'⌝ es decir,

"dy/dx" es la abreviatura de "y'/x'"

Esto significa que φ y ψ deben ser nombres de las funciones de los reales a los reales.

Q1.2 existen otras definiciones formales en la literatura que debo comparar a estos? No he encontrado todavía...

Harrison definición no devuelve un valor, porque una variable libre es uninstntiated, en el mismo sentido en que wffs que no son oraciones no devolver un valor de verdad. Thurston versión, sin embargo devuelve una función.

Por ejemplo,

df/dx = f'(x) para harrison, df/dx = f' para thurston

Más concretamente

d(x2+x)/dx = 2x+1 para harrison λx.2x+1 de thurston

Q2 es el valor de "2x+1' que contiene variables libres que se están devolviendo, o estamos implícitamente la cuantificación de más de x, o, vamos a llamar 'ξ" para los fines de cuasi cita, y diciendo: ∀ξ, ⌜2ξ+1⌝ se refiere (no 'es') el valor devuelto?

Sin embargo, considerar el siguiente 'típico' de cálculo problema:

" y = f(x) x = g(u) g(x) = x3 - 7

encontrar df/dx "

Thurston nos df/dx = λx.1/(3x2) Este es indefinido en harison del enfoque, ya que x no es una variable de la lógica, sino el nombre de una función.

Q3 debo estar considerando la posibilidad de que la lógica permite que las variables que van más funciones?

Y si fingimos que era aún estaríamos obtener df/dx = D(λx.f)(x), pero esto está mal-formados desde λx necesita algo como " f(x)' en lugar de 'f' como entrada.

Y si añadimos un caso de harrison definición para append '(x)' o como cuando le falta, aún estaríamos obtener df/dx = 1, que no es igual que el resultado obtenido con thurston definición -, pero lo más sorprendente es la función que se evalúa para obtener 1 fue, unike el' f vs f'(x) caso anterior, ni siquiera la misma función que fue devuelto por thurston definición.

P4 ¿Qué debo concluir, por el hecho de que estas definiciones difieren de esta manera?

Ahora considere la posibilidad de:

" y = f(x) f(x) = x⁹

encontrar dy/dx "

En harrison cuenta, podríamos ver como una metavariable, de modo que f(x) se coloca substitutionally en la definición de la cadena, pero tengo la sensación de que no es la manera correcta de entender. Sin embargo, si y es simplemente una variable de la lógica, es una libre variable en el resultado, y terminamos con una variable libre demasiados..

En thurston de la cuenta, y debe ser el nombre de una función, pero "la forma y = f(x)" establece y igual a una expresión con una variable libre, no es igual que el nombre de una función

Q5 debo ver frases como "y=f(x)" como algo que implica una suprimidos "(x)" y "∀" para que se "∀x,y(x)=f(x)" ? O debo ver y como una metavariable? O, debo imaginar la lógica extendida para permitir que algunos de los nuevos sintáctica de la categoría de "dependiente" de las variables, mientras que el pensamiento de las variables habituales en la lógica como "independiente" de las variables, es decir, aquellos cuyo valor no depende de otros? Creo que estoy muy confundido acerca de lo que happends cuando una variable depende de la otra.

P6 En una nota relacionada, vi un pasaje recientemente que habló en términos como "x(u) es la función inversa de u(x)"--¿cómo debe ser entendida más precisamente? He llegado a descubrir que no entiendo expresiones de este tipo en todo!

Q7 ¿cualquiera de estos defintions claramente la captura de 'práctica' mejor que otro?

P8 ¿Cómo debe intentos similares para el 'del' notación para patial derivados?

P9 alguien Puede darme un ejemplo de donde d/dx y del/delx devolver valores diferentes en la misma entrada? Si no me equivoco, en algunas formalizaciones esto nunca sucede, y en otras formalizaciones lo hace ... creo que harrison no iba a permitir esto, ya que simplemente devuelve un 'expresión', en lugar de una de las varias funciones que pueden estar formados por una expresión cuando se aplica un operador lambda.

Empecé tratando de leer este artículo sobre la revisión de la patial derivado de la notación:

[He golpeado mi enlace de límite como soy nuevo aquí, pero google "revisada la notación de derivadas parciales" (con comillas). Es por WC Hassenpflug]

pero me quedé atrapado en la frase:

"Si tenemos una función u = f(x,y) y la transformación y=g(x∩), no está claro si los del u / dx medio del u / dx |y o del s / dx | n"

Puede alguien explicar que uno para mí?

Q10 todo Esto guarda cierta similitud superficial de la relación entre los llamados "variables aleatorias", que son en realidad funciones, y lo que se llaman "variables" en la lógica subyacente--esto también ha confundido a mí, y veo que muchas de las operaciones que se realicen en el texto en variables aleatorias en los que los operadores sólo se han definido para valores de la variable aleatoria del dominio, y no en funciones. ¿Alguien puede comentar sobre esto? Yo sería bueno si pudiera despedir a dos largas confusiones con una piedra :p

10voto

Aleksandr Levchuk Puntos 1110

Eso es un montón de preguntas! Estoy de acuerdo con algunos de sus puntos acerca de la notación, pero por desgracia eso es sólo cómo se (ab)usado en la práctica común. Sin embargo, también creo que se está pensando muy mucho acerca de lo que significa cada cosa. Sospecho que la mayoría de los autores en este nivel no se preocupe por el uso de una buena notación y distinguir entre la libertad de variables y variables vinculadas y crear instancias de las variables y así sucesivamente.

Vamos a comenzar por la discusión de Lagrange notación, ya que esta es la más cercana en su forma pura-la notación funcional. Si usted tiene una función $f: U \to \mathbb{R}$, $U$ un subconjunto abierto de $\mathbb{R}$, podemos decir que es diferenciable en a $U$ si hay una función de $f': U \to \mathbb{R}$ tal que $$\forall x. \forall \epsilon. \exists \delta. \forall h. [ \epsilon > 0 \land \delta > 0 \land |h| < \delta \land x \in U \land x + h \in U \implies |f(x) - f(x + h) - h f'(x)| < \epsilon ]$$ Tenga en cuenta que no hay dependencia de la forma en que las funciones están definidas y que depende exclusivamente de la extensional propiedades de la función.

Ahora, el problema con la comprensión de la notación de Leibniz en este marco es que a menudo uno quiere escribir $\dfrac{df}{dx}$$f'(x)$, pero entonces esto conduce a absurdos tales como $\dfrac{df}{d2}$$f'(2)$. Así lo que algunos autores hacer es escribir $\dfrac{df}{dx}(2)$ $f'(2)$ ... que también es problemático, ya que parece decir que el $f$ inherentemente depende de $x$. Creo que la notación de Leibniz, se entiende mejor en un marco en el que uno tiene expresiones dependiendo de algunos fijos conjunto de variables, en lugar de en un marco en el que hay que tratar con funciones y los números directamente. (Yo, personalmente, creo notación de Leibniz, debe ser abolido. Un amigo mío - muy competente en el cálculo - una vez malinterpretado $f'(2x)$ como el sentido de la misma cosa como $\dfrac{d}{dx}[f(2x)]$ cuando en realidad la última expresión es el doble de la anterior.)

Críticas similares pueden hacerse respecto a la notación de derivadas parciales, pero aquí hay un problema porque no hay buenas alternativas. Mathematica se generaliza la notación de Lagrange para este propósito: por ejemplo, $f^{(0, 1, 0)}$ significa que la primera derivada parcial de $f$ con respecto a su segunda variable. En esta notación, el Laplaciano de una función de $f$ de tres variables puede escribirse como $f^{(2, 0, 0)} + f^{(0, 2, 0)} + f^{(0, 0, 2)}$, donde además se pointwise. El problema con esta notación es que asume que la diferenciación parcial con respecto a diferentes variables de los viajes, pero no se sostiene cuando la función no está lo suficientemente suave. Otra alternativa es la de Einstein índice de notación, en la que $f_{i,jk}$ $i$- ésima componente del vector de valores de la función $f$ diferenciadas con respecto a las $j$-ésima variable y, a continuación, de nuevo con respecto a la $k$-ésima variable. En Penrose abstracto índice de la notación de este lugar, significa el segundo total derivado de la $f$. También hay un poco de la no-estándar de lectura de $\dfrac{\partial}{\partial x}$ donde todo símbolo es considerado como el nombre de un operador diferencial. Esto es por lo general en el contexto de la geometría diferencial, y encaja con la identificación de los vectores de tangentes como operadores diferenciales.

Finalmente, con respecto a las variables aleatorias: creo que esta es en realidad relativamente fácil de ordenar en comparación con la notación de Leibniz lío. En el test de Kolmogorov formalismo, una variable aleatoria es una función del subyacente espacio muestral. Para la simplicidad de exposición voy a suponer que trabajamos con verdaderos valores de variables aleatorias. Podemos definir un álgebra real de los valores de las variables aleatorias por pointwise operaciones: si tengo dos variables aleatorias $X, Y : \Omega \to \mathbb{R}$, hay variables aleatorias $X + Y, XY: \Omega \to \mathbb{R}$ donde$(X + Y)(\omega) = X(\omega) + Y(\omega)$$(XY)(\omega) = X(\omega) Y(\omega)$, y para cada una de las $\lambda \in \mathbb{R}$ no es una variable aleatoria que toma el valor constante $\lambda$, en todos los puntos de la muestra. Pero mejor que eso, podemos aplicar arbitraria de funciones medibles $\mathbb{R} \to \mathbb{R}$ a las variables aleatorias para obtener nuevas: así que si $f: \mathbb{R} \to \mathbb{R}$ es medible y $X : \Omega \to \mathbb{R}$ es una variable aleatoria, entonces $f(X) : \Omega \to \mathbb{R}$ es sólo el compuesto $f \circ X$. Hay otros formalismos donde el espacio muestral es no sólo suprime pero totalmente ausente; Terence Tao tiene una entrada de blog acerca de este punto de vista.

2voto

Andrew Davey Puntos 2322

Yo no propongo esto como una respuesta apropiada, pero es demasiado largo para un comentario.

El mismo problema preocupante mí hace algún tiempo. En mi humilde opinión notación de Leibniz se puede poner en un motivo de forma, pero el contexto en el que trabaja es claramente diferente. Algo así como: el Cálculo se realiza en un "diagrama". Un diagrama es un conjunto de variables y asignaciones

variable→conjunto

(lista de variables)×variable→función

Funciones de ir entre las variables. El diagrama de desplazamientos en la categoría de la teoría del sentido. Así, dada una variable v, se puede obtener una función de v a partir del diagrama. Esto permite a "diferenciar una variable". (También se puede definir un diagrama como un producto de la preservación de functor a partir de un número finito de poset categoría con productos a Juego.) Cada expresión con operaciones como la suma y el producto se crea una nueva variable v y una nueva función ...→v . Asimismo, el diferencial de operador. Esto permite hablar oficialmente sobre derivadas parciales también, demostrar la regla de la cadena, etc. Sin embargo, no he perseguido mi idea y nunca encontré algo en la literatura.

0voto

goblin Puntos 21696

He aquí un poco de una idea especulativa. Estoy haciendo esta wiki de la comunidad; cada uno es libre de modificarlo como desee, usted puede trabajar en pequeños trozos de la misma, etc. Tal vez esto eventualmente evolucionar hacia una verdadera solución viable.

Escribir $\langle x:X,y:Y\rangle$ a la media de $X \times Y$, o quizás $Y \times X$, pero en lugar de hacer referencia a las coordenadas utilizando números naturales $0,1,2$ etc. y poner artificial de pedidos en ellos, sólo tiene que utilizar la proyección de las funciones de $x$ (que tiene el tipo de $\langle x:X,y:Y\rangle \rightarrow X$) y $y$ (que tiene el tipo de $\langle x:X,y:Y\rangle \rightarrow Y$) para obtener la información que desea. Esto puede ser extendido a más variables en la forma obvia. Podemos formalizar mediante la categoría de la teoría; $\langle x:X,y:Y\rangle$ es sólo el terminal de objeto en la categoría de conjuntos de $S$ equipada con proyecciones de $x : S \rightarrow X$$y : S \rightarrow Y$.

Necesitamos ir un poco más allá. Dado que el $S$ es un conjunto equipado con proyecciones de $x$$y$, escribir $S \mid P(x,y)$ para el conjunto de todos los $s \in S$ tal que $P(x(s),y(s))$ mantiene. Una vez más, esto puede ser extendido a más variables en la forma obvia. Observe que:

$$(S \mid P(x,y)) \mid Q(x,y) = S \mid P(x,y) \,\&\, Q(x,y)$$

Vamos a considerar un ejemplo.

En lugar de escribir:

Asumir:$$y=x^2, \; x = t^3$$

nos gustaría que en lugar de escribir:

Deje $C$ el valor del sistema:$$y=x^2, \; x = t^3$$

por lo que en realidad queremos decir:

Deje $C = \langle x,y,t : \mathbb{R}\rangle \mid y=x^2 \:\&\: x=t^3.$

De este modo, el problema de cómo distinguir. Supongamos que tenemos una función de $f : \langle x:X,y:Y\rangle \rightarrow \mathbb{R}.$, Entonces el significado de la siguiente expresión es clara:

$$\frac{\partial}{\partial x} f$$

Total de productos derivados son más difíciles. Deje $C$ denotar un subconjunto de a $\langle x:X,y:Y\rangle$. ¿Qué debe hacer el siguiente media?

$$\frac{d^C}{dx}f$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X