52 votos

¿Qué significa "realmente" la inversión Mellin?

Dada una función $f: \mathbb{R}^+ \rightarrow \mathbb{C}$ que satisfaga las condiciones adecuadas (decaimiento exponencial en el infinito, variación continua y acotada) es suficiente, su Transformación de Mellin está definida por la función

$$M(f)(s) = \int_0^{\infty} f(y) y^s \frac{dy}{y},$$

y $f(y)$ puede recuperarse mediante la fórmula de inversión de Mellin:

$$f(y) = \frac{1}{2\pi i} \int_{\sigma - i \infty}^{\sigma + i \infty} y^{-s} M(f)(s) ds.$$

Esto es un cambio de variable de la fórmula de inversión de Fourier, o de la fórmula de inversión de Laplace, y se puede demostrar de la misma manera. Esto se utiliza todo el tiempo en la teoría analítica de los números (así como en muchos otros temas, según tengo entendido) -- por ejemplo, si $f(y)$ es la función característica de $[0, 1]$ entonces su transformada de Mellin es $1/s$ y se recupera el hecho (fórmula de Perron) de que

$$\frac{1}{2\pi i} \int_{2 - i \infty}^{2 + i \infty} n^{-s} \frac{ds}{s}$$

es igual a 1 si $0 < n < 1$ y es 0 si $n > 1$ . (Obsérvese que hay cuestiones técnicas que estoy glosando; se integra sobre cualquier línea vertical con $\sigma > 0$ y la integral es igual a $1/2$ si $n = 1$ .)

Utilizo estas fórmulas con frecuencia, pero... Me encuentro con que tengo que buscarlas repetidamente, y me gustaría entenderlas de forma más intuitiva. La fórmula de Perron se puede demostrar utilizando la fórmula del residuo de Cauchy (desplazar el contorno a $- \infty$ o $+ \infty$ dependiendo de si $n > 1$ ), pero esta prueba no demuestra la fórmula general de inversión de Mellin.

Mi pregunta es:

¿Qué significan la transformada de Mellin y la fórmula de inversión? Moralmente, ¿por qué son ciertas?

Por ejemplo, ¿por qué la transformada de Mellin es una integral sobre los reales positivos, mientras que la transformada inversa es una integral sobre el plano complejo?

He encontrado algunos recursos Wikipedia; esta pregunta del modus operandi está estrechamente relacionado, y el primer vídeo en particular es bonito; y una prueba se esboza en Iwaniec y Kowalski -- pero creo que debería haber una explicación más intuitiva que cualquiera que se me haya ocurrido hasta ahora.

29voto

[Como contrapunto a otros puntos de vista, se puede decir que la inversión de Mellin es "simplemente" la inversión de Fourier en otras coordenadas. Según el temperamento de cada uno, esto de las "otras coordenadas" oscila entre la irrelevancia y la sustancia... La cuestión de los imperativos morales de la inversión de Fourier se aborda un poco más abajo.

[Añadido: el mapa exponencial $x\rightarrow e^x$ da un isomorfismo del grupo topológico de los reales aditivos a los multiplicativos. Así pues, el análisis armónico sobre los dos es necesariamente "el mismo", aunque los aspectos fórmicos parezcan diferentes. El tratamiento ocasional de los valores (y las derivadas) en $0$ para funciones sobre los reales positivos, como en las "transformadas de Laplace", es un detalle relativo, que ciertamente tiene su correspondiente discusión para las transformadas de Fourier].

El riff específico de la identidad de Perron en la teoría analítica de los números equivale (si se tolera un cambio de coordenadas) a adivinar/discernir una función L^1 en la recta cuya transformada de Fourier es (¡¿en qué espacio de funciones?!) la función característica de una semirrecta.

Dado que el char fcn de una media línea no está en L^2, y no va a 0 en el infinito, seguramente habrá problemas analíticos... pero estos son técnico no conceptual.

[Añadido: las familias de la transformada de Fourier $x^{\alpha-1}e^{-x}\cdot \chi_{x>0}$ y $(1+ix)^{-\alpha}$ (hasta las constantes) donde $\chi$ es la función característica, cuando se traslada a coordenadas multiplicativas, dan una familia que se aproxima al efecto deseado de "corte" de la integral de Perron. También hay otras familias útiles].

Para mi gusto, las delicadezas/fracasos/técnicas de los aspectos no tan legales de las transformadas de Fourier son aplastadas en su mayoría por simples ideas sobre los espacios de Sobolev y las distribuciones de Schwartz... que no cambian las realidades subyacentes. Sólo nos liberan de una parte de la carga de la alharaca equivocada de algunos guardianes autoproclamados de una mala comprensión de la tradición Cauchy-Weierstrass.

[Añadido: seguramente estas observaciones parecerán a algunos lectores como una poética inapropiada... pero es fácil ser más contundente, si se desea. A saber, en varios contextos comunes se hace un énfasis inútil y desproporcionado en el "rigor". A menudo, el análisis elemental es el chivo expiatorio de este impulso, pero también se puede ver cómo se dificulta sin sentido la teoría elemental de los números de manera similar. Supuestamente, se está concienciando al público de la "necesidad/imperativo" de cuidar los detalles delicados. Sin embargo, en la práctica, uno puede encontrarse en el papel del dilbertiano "Mordac el Preventor (de los servicios de información)" [ver wiki] demostrando cosas como el teorema del valor intermedio a los estudiantes de cálculo: es obviamente cierto, primero, o bien hay que ajustar el significado de "continuo" o de "números reales"; sin embargo, la historia tradicional es que hay que deslegitimar esta intuición, y luego poner en su lugar un sustituto muy estilizado. ¿Cuál ha sido la ganancia? Sí, algo fundacional, pero el tiempo ha pasado, y apenas hemos recuperado, a costa de algo, lo que obviamente era cierto al principio.

Por otro lado, la irritación de Bochner con la "teoría de las distribuciones" era que ya estaba claro que él que las cosas funcionaran así, y a ya podía responder a todas las preguntas sobre las funciones generalizadas... así que ¿por qué impresionarse con la "mecanización" de Schwartz? Para mí, la respuesta es que Schwartz arregló una situación para que "cualquier idiota" pudiera utilizar las funciones generalizadas, mientras que antes era un "arte". Sí, le quitó un poco de diversión... pero tal vez las necesidades prácticas prevalezcan sobre la preservación de la camaradería de la sociedad secreta].

¿Por qué debe haber inversión de Fourier? (por ejemplo...) Bueno, podemos decir que quiere tal cosa, porque diagonaliza el operador $d/dx$ en la línea (y se pueden decir cosas más complicadas en situaciones más complicadas).

Entre otras cosas, esto hace posible la "ingeniería matemática"... Es decir, uno puede entender y justificar las ideas casi demasiado buenas para ser verdad que parecen "necesarias" en situaciones aplicadas... donde no puedo evitar añadir "como la teoría de números moderna". :)

[Añadido: al ser un poco autodidacta, no fui consciente hasta relativamente tarde de que la "prueba" era absolutamente sacrosanta. ¿Hasta el punto del fetichismo? De hecho, parece que valoramos colectivamente las conjeturas perspicaces y las heurísticas no del todo justificables, y las ideas interesantes no resueltas ofrecen más oportunidades de compromiso que las discusiones asentadas, férreas y acabadas. En este sentido, los momentos en los que uno intuye "la verdad", y luego empieza a buscar razones, son posiblemente más memorables, más divertidos, que los momentos en los que uno ha puesto los puntos sobre las íes en la demostración de un lema no particularmente interesante cuya verdad era bastante obvia todo el tiempo. Más ominoso es el hecho de que a veces podemos ver que algo es cierto y funciona a pesar de no poder "justificarlo". El trabajo de Heaviside es un ejemplo. El telégrafo transatlántico funcionó bien a pesar de...]

En otras palabras: descomposición y síntesis espectral. ¿A quién no le puede gustar?

[Añadido: ¿y qué recurso tenemos que esperar que los operadores razonables sean diagonalizables, etc.? Serre y Grothendieck (y Weil) sabían desde hace años que el teorema de punto fijo de Lefschetz debía tener una encarnación que expresara las funciones zeta de las variedades en términos de cohomología, antes de poder darle sentido a esto. La prueba de Ngo (Loeser, Clucker, et alteri) del lema fundamental en el caso del campo de números mediante la transferencia de la teoría de modelos desde el caso del campo de funciones no es algo que quisiera tener que "justificar" ante los negacionistas].

24voto

John Mac Puntos 1095

¡Gracias a todos los que han respondido! Un resumen (CW'ed) de lo que he aprendido:

En primer lugar, apoyo la recomendación de Greg Martin sobre el capítulo 5.1 de Montgomery y Vaughan. Es un tratamiento más bien "lowbrow", muy legible. (no demuestra la inversión de Mellin con total generalidad)

Además, como señaló Matt Young, para cualquier complejo $s$ la función $t \rightarrow t^s$ es un personaje de $\mathbb{R}^{\times}$ . Esto es una trivialidad, pero la importancia de este hecho se me escapó la primera vez. La medida invariante en $\mathbb{R}^{\times}$ es $\frac{dx}{x}$ por lo que la transformada de Fourier de una función $f$ definido en este grupo es exactamente

$$\int_{x \in \mathbb{R}^{\times}} f(x) x^s \frac{dx}{x},$$

la transformada de Mellin. Una vez escrito esto, el resto se deduce mecánicamente (a partir del cambio de variables y la inversión de Fourier).

¡Gracias a todos!

18voto

dmazzoni Puntos 6586

Como otros han señalado, el teorema de inversión de Mellin no es más que el teorema de inversión de Fourier disfrazado para el grupo particular ${\mathbb R_+}$ con medida invariante $\frac{dx}{x}$ . El objetivo de la transformada de Fourier es expresar una función general como una combinación lineal (es decir, integral) de los caracteres del grupo, de modo que en esta base las operaciones de traslación y todas las operaciones conmutativas estarán diagonalizadas. Para la ${\mathbb R_+}$ Estos personajes parecen $x \mapsto x^{-s}$ (el signo menos por la normalización que has elegido en la pregunta), y son unitarios (toman valores en el círculo) para los imaginarios $s$ -- la operación de multiplicar caracteres es sólo una suma en el $s$ variable, por lo que en la fórmula de inversión se tiene la medida $ds$ . También hay una cosa curiosa sobre cómo hay $s$ con parte real positiva -- esto es porque en el "espacio físico" ${\mathbb R_+}$ siempre se habla de distribuciones que se apoyan de forma compacta lejos de $0$ cuando se utiliza esta transformación. Ignoremos eso.

Dado que la inversión de Mellin es una inversión de Fourier disfrazada, la verdadera pregunta es: ¿por qué la fórmula de inversión de Fourier en ${\mathbb R}$ ¿es cierto? Para mí la respuesta más convincente es la siguiente: podemos descomponer una función general $f(x) = \int f(y) \delta(x-y) dy$ (esta es la definición de $\delta$ pero hay que tomar funciones delta aproximadas para que esto funcione rigurosamente como una descomposición), así que si queremos expresar una función general como una combinación de los caracteres $x \mapsto e^{2 \pi i \xi x}$ basta con considerar el $\delta$ función

$\delta(x) = \int u(\xi) e^{2 \pi i \xi x} d\xi $

Una interpretación de esta idea formal es que las distribuciones $\delta(x-y)$ son como las funciones de base habituales.

Ahora, observe que porque $\delta(x)$ es invariable bajo la multiplicación por $e^{2 \pi i \eta x}$ para cualquier $\eta$ la distribución $u(\xi)$ es invariable por traslación y, por tanto, debe ser constante. Una vez encontrada la constante, al introducir $\delta(x) = C \int e^{2 \pi i \xi x} d\xi$ en $f(x) = \int f(y) \delta(x-y) dy$ da la fórmula de inversión de Fourier. Las pruebas completas y rigurosas siguen más o menos estas líneas, pero hay muchos sabores de cómo te gusta expresarlo. Por supuesto, podemos escribir todo el argumento con caracteres multiplicativos también.

Edición: El argumento anterior asume la unicidad de la representación, pero también se puede observar que si hay incluso una única función $f(x)$ para lo cual $\int f(x) dx \neq 0$ y que puede realizarse como una combinación lineal $\int \hat{f}(\xi) e^{2 \pi i \xi \cdot x} d\xi$ entonces, reescalando, renormalizando y tomando un límite, obtenemos $\delta(x) = C \lim_{\epsilon \to 0} \epsilon^{-1} f(x/\epsilon)$ lo que conduce formalmente a la fórmula $\delta(x) = C \int e^{2 \pi i \xi \cdot x} d\xi$ . Una ejecución rigurosa común de esta filosofía se realiza tomando $f$ para ser una gaussiana.

12voto

Shoban Puntos 18742

Dos ecuaciones que encapsulan las propiedades de las transformadas de Fourier y Mellin:

$$\int^{\infty}_{-\infty}{\exp(2 \pi ifx)\exp(-2 \pi ify)df} = \delta(x-y)$$

$$\frac{1}{2\pi i} \int_{\sigma - i \infty}^{\sigma + i \infty} x^{-s} y^{s} ds= \delta(\ln(x)-\ln(y))= y \delta(x-y).$$

Las transformaciones de una ecuación a la otra son evidentes. Los resultados de la función delta son intuitivos y una extrapolación del caso discreto para las relaciones de ortogonalidad de los caracteres de los grupos de caracteres. Los pares de transformaciones, los teoremas de Plancherel y de convolución, y otras relaciones son fáciles de derivar a partir de estos dos.

(Obsérvese que mientras que $e^{sz}$ es una función propia de $d/dz$ por lo que las transformadas de Laplace/Fourier son apropiadas para idear un cálculo de operadores para $f(d/dz)$ , $z^s$ es una función propia de $zd/dz$ por lo que la transformada de Mellin es más apropiada para $f(zd/dz)$ .)

Fórmula/teorema magistral de Ramanujan (véase Wikipedia ) ofrece una perspectiva un tanto intuitiva de la transformada de Mellin como una "interpolación" de los coeficientes de las series de Taylor de ciertas clases de funciones, como se discute en la introducción de " Teorema maestro de Ramanujan ..." de Olafsson y Pasquale. Por ejemplo,

$$\int^{\infty}_{0}f(x)\frac{x^{s-1}}{(s-1)!} dx = g(-s)$$ y

$$\frac{1}{2\pi i} \int_{\sigma - i \infty}^{\sigma + i \infty} \frac{\pi}{\sin(\pi s)} g(-s) \frac{x^{-s}}{(-s)!} ds = \sum_{n=0}^{\infty} g(n) \frac{(-x)^{n}}{n!} = f(x)$$

para los pares de transformación

$f(x)=\exp(-x)$ y $g(-s)= 1$ $(\sigma>0)$ y

$f(x)=\frac{1}{1+x}$ y $g(-s)= (-s)!$ $(0<\sigma<1$ y $abs(x)<1)$

$f(x)=\exp(-x^2)$ y $g(-s)= \cos(\pi\frac{ s}{2})\frac{(-s)!}{(-\frac{s}{2})!} = \frac{1}{2}\frac{(\frac{s}{2}-1)!}{(s-1)!} $ $(\sigma>0)$ .

Desde una perspectiva similar, la icónica integral de Euler (Mellin) para la función gamma para $Real(s) > 0$

$$ \displaystyle \int_0^\infty \frac{t^{s-1}}{(s-1)!} \; e^{-t\;p} \; dt = p^{-s}$$

proporciona el andamiaje para comprender y utilizar la interacción entre la transformada de Mellin, su inversa, el cálculo de operadores y la interpolación.

Una interpolación natural de la derivada como la integroderivada fraccionaria del cálculo fraccionario se obtiene utilizando la transformada de Mellin para interpolar los coeficientes de la op e.g.f. $\displaystyle e^{tD_x} \;,$ es decir, el op de desplazamiento, para las potencias enteras de la derivada:

$$\displaystyle \int_0^\infty \frac{t^{s-1}}{(s-1)!} \; e^{-tD_x} \; dt \; H(x) g(x) = D_x^{-s} H(x) g(x) = \int_0^\infty \frac{t^{s-1}}{(s-1)!} \; e^{-tD_x} \; H(x) g(x)\; dt$$

$$\displaystyle = \int_0^\infty \frac{t^{s-1}}{(s-1)!} \; H(x-t) \; g(x-t) dt \; . $$

Entonces, actuando específicamente sobre la función de potencia para $\displaystyle \alpha > -1$

$$ \displaystyle \int_0^\infty \frac{t^{s-1}}{(s-1)!} \; H(x-t) \; (x-t)^\alpha dt = \int_0^x \frac{t^{s-1}}{(s-1)!} \; (x-t)^\alpha \; dt $$

$$\displaystyle = \int_0^x \frac{t^{s-1}}{(s-1)!} \; \sum_{k \ge 0} (-1)^k \; x^{\alpha-k} \frac{\alpha!}{(\alpha-k)} \; \frac{t^k}{k!} \; dt = \frac{1}{(s-1)!} \sum_{k \ge 0} (-1)^k \; x^{\alpha-k} \binom{\alpha}{k} \; \frac{t^{s+k}}{s+k} \; |_{t=0}^{x}$$

$$\displaystyle = x^{\alpha + s} \; (-s)! \; \sum_{k \ge 0} \; \binom{\alpha}{k} \; \frac{sin(\pi (s+k))}{\pi (s+k)} = x^{\alpha +s} \frac{\alpha!}{(\alpha+s)!} \; = D_x^{-s} x^\alpha \; .$$

El último sumatorio converge sin restricción en $s$ . Así, vemos que la transformada de Mellin interpola efectivamente los coeficientes de la f.e.g. generada por la expansión del teorema del binomio $\displaystyle x^{\alpha-k} \frac{\alpha!}{(\alpha-k)}$ a $\displaystyle x^{\alpha+s} \frac{\alpha!}{(\alpha+s)}$ para dar una interpolación de los coeficientes de la operación de desplazamiento $ D_x^k$ a $ D_x^{-s}$ consistente con el cálculo fraccionario.

El mismo método puede utilizarse para interpolar

$$\displaystyle (x \; D_x \;x)^n = x^n D_x^n x^n = x^n \; n!\; L_n(-:xD_x:) , $$

donde $ L$ denota los polinomios de Laguerre y $(:xD_x:)^k = x^kD_x^k$ por definición, lo que lleva a

$$ \int_0^\infty \frac{t^{s-1}}{(s-1)!} \; e^{-txD_xx} \; dt \; H(x) x^\alpha = (xD_xx)^{-s}\; x^\alpha = \int_0^\infty \frac{t^{s-1}}{(s-1)!} \; \frac{x^\alpha}{(1+xt)^{\alpha+1}} \; dt = x^{\alpha-s} \frac{(\alpha-s)!}{\alpha!} = x^{-s} D_x^{-s} x^{-s} \; x^\alpha $$

para $ 0 < Real(s) < \alpha +1 \; .$

O bien, dar la continuación analítica para una transformada de Mellin relacionada con una clase de operadores diferenciales que abarcan el álgebra de Lie de Witt:

$$ (x^{1+y}D_x)^{-s} \; x^\alpha = \int_0^\infty \frac{t^{s-1}}{(s-1)!} \; H[\frac{x}{(1+y\;t\;x^y)^{1/y}}] \frac{x^\alpha}{(1+y\;t\;x^y)^{\alpha/y}} \; dt $$

$$= H(y) \; x^{\alpha-sy} y^{-s} \frac{(-s+\alpha/y-1)!}{(\alpha/y-1)!} \;+ \; H(-y) \; x^{\alpha+s|y|} |y|^{-s} \frac{(\alpha/|y|)!}{(\alpha/|y|+s)!} \;.$$

Una forma sencilla de derivar las fórmulas de tu pregunta es mirando la transformada inversa de Mellin rep de la función delta de Dirac. Véase mi breve nota sobre la La transformada inversa de Mellin y la función delta de Dirac . Vea también algunas aplicaciones en La función delta de Dirac y la función de salto de Riemann J(x) para los primos y La transformada inversa de Mellin, los polinomios de Bell, una relación de Dobinski generalizada y las funciones hipergeométricas confluyentes .

Edwards en La función zeta de Riemann en el cap. 10 Análisis de Fourier Sec. 10.1 Operadores invariantes en R+ y sus transformadas ofrece una buena introducción a la transformada de Mellin, más teórica, en línea con otros comentarios de esta corriente.

9voto

Gareth Puntos 42402

Echa un vistazo al apéndice de Zagier: http://people.mpim-bonn.mpg.de/zagier/files/tex/MellinTransform/fulltext.pdf

Proporciona una buena descripción de la transformada de Mellin cuando $f(x)$ es suficientemente suave en $x=0$ y de rápido decaimiento en el infinito.

Por ejemplo, supongamos que $f(x) = \sum_0^\infty a_n x^n$ en algún lugar cercano al origen, y decae rápidamente como $x \to \infty$ , entonces su transformada de Mellin tiene continuación meromórfica a todo $\mathbb{C}$ con polos simples de residuos $a_n$ en $s=-n$ , $n=0,1,2,3,\ldots$ . Esto se explica muy bien en el apéndice de Zagier.

Por lo tanto, dejando a un lado los problemas de la tasa de decaimiento, desplazar la transformada inversa de Mellin hacia la izquierda, es decir, dejar que $\sigma \to -\infty$ , recoge los residuos del integrando en s=-n, es decir $a_n x^n$ es decir, recupera la expansión de Taylor sobre $x=0$ de $f(x)$ .

Por supuesto, sólo se aplica a una clase limitada de funciones $f$ pero, en muchos ejemplos prácticos, este razonamiento da una explicación de por qué la fórmula de inversión de Mellin es verdadera, sin recurrir a la inversión de Fourier.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X