5 votos

El mal uso de la $\delta$

En física e ingeniería es habitual utilizar la distribución delta de Dirac para representar "densidades" de variables aleatorias discretas. Es una construcción muy útil y se pueden hacer muchas cosas con ella fácilmente.

$$f_{\pmb x}(x)=\sum_{n=1}^{\infty}P(\pmb x = x_n) \,\delta(x-x_n) \;=\; \sum_{n=1}^{\infty}p_n \,\delta(x-x_n)$$

$$E_{f_{\pmb x}}\{\delta(g(\pmb x))\} \;=\; \sum_i \frac{f_{\pmb x}(x_i)}{{|g'(x_i)|}}\enspace, \quad \text{ with } g(x_i)=0 \text{ and } g'(x_i)\neq 0$$

$$\pmb y = g(\pmb x) \quad\Rightarrow \quad f_{\pmb y}(y) \;=\; E_{f_{\pmb y}}\{\delta(\pmb y - y)\} \;=\; E_{f _{\pmb x}}\{\delta(g(\pmb x)-y)\}$$

Pero los matemáticos siempre dicen que sería matemáticamente objetable o incluso incorrecto, porque una función de densidad formada por distribuciones delta no es continua ni integrable. Sin embargo, la definición de la distribución delta define precisamente su integral. Entonces, ¿cuál es el problema aquí?

¿Hay algún ejemplo en el que el uso de la función delta de Dirac pueda llevar a resultados erróneos?

11voto

jbwiv Puntos 466

Lo que dicen los matemáticos no es que la función delta de Dirac no sea continua o integrable, lo que requiere que el objeto en cuestión sea un $\mathbf R\to\mathbf R$ sino que ni siquiera es una función $\mathbf R\to\mathbf R$ función. Sin embargo, la función delta de Dirac está rigurosamente definida, sólo que no como una $\mathbf R\to\mathbf R$ sino una clase de funcionales lineales, que es una función lineal desde un espacio de funciones hacia el conjunto de números reales (complejos) $\mathbf R$ , llamado distribución o función generalizada .

7voto

leftaroundabout Puntos 1343

La distribución de Dirac es realmente una función - concretamente, una funcional $$ \tilde\delta : (\mathbb{R} \to \mathbb{R}) \to \mathbb{R}, \qquad \tilde\delta(f) := f(0). $$ Esta definición es perfectamente sencilla e incontrovertible.

Lo curioso es que, en realidad, ¡nadie lo utiliza así! Por una razón que me parece extraña, los físicos y también muchos matemáticos parecen en realidad más recelosos de una función tan simple, pero de "orden superior", que de una función en el propio eje real, aunque requiera "infinitos valores de función" para funcionar.

Lo que ocurre en realidad con la definición estándar es lo siguiente: las funciones $\mathbb{R} \to \mathbb{R}$ formar un espacio vectorial . Si se reduce a sólo las funciones cuyo cuadrado es integrable en todo el dominio, se obtiene el $L^2(\mathbb{R})$ Espacio de Hilbert .

Una de las cosas buenas de los espacios de Hilbert es la Teorema de la representación de Riesz . Dice, a grandes rasgos, que un espacio de Hilbert es isomorfo a su espacio dual; en este caso significa, el espacio de funcionales lineales † $L^2(\mathbb{R}) \to \mathbb{R}$ es isomorfo a $L^2(\mathbb{R})$ sí mismo. Es decir, cualquier función cuadrada-integrable tiene una función canónica correspondiente a la inversa. Estos pares correspondientes están siempre dados básicamente por imitando la integral sobre el producto . Por ejemplo, $g(x) = e^{-x^2/2}$ tiene el correspondiente funcional $$ \tilde g(f) = \int_\mathbb{R}\!\!\mathrm{d}x \: g(x)\cdot f(x). $$ Esa elección es canónica porque se puede reconstruir $g$ de ese funcional, como la única función de norma unitaria que maximiza la $L^2$ producto escalar. (Que esto sea posible en un espacio de Hilbert -gracias a la propiedad de completitud- es lo interesante del teorema de la representación de Riesz).

Ingenuamente, podríamos deducir de esto que $\tilde\delta$ tiene una función correspondiente $\mathbb{R}\to\mathbb{R}$ . Al fin y al cabo es un funcional sobre funciones, y entonces también podemos considerarlo sólo sobre las que son cuadradas-integrables... ¿cuál es el problema?

Bueno, el problema † es que $L^2(\mathbb{R})$ no es realmente una restricción de integrabilidad del espacio de funciones. En realidad es un espacio de clases de equivalencia de tales funciones: cuando dos funciones sólo difieren en un Conjunto nulo de Lebesgue se consideran el mismo elemento de $L^2(\mathbb{R})$ . Y eso significa $\tilde\delta$ no está definido en realidad en $L^2(\mathbb{R})$ porque si se cambia la función sólo en el punto 0 se obtendría un resultado diferente, pero del "mismo" argumento. Y eso sería su resultados erróneos del uso ingenuo de $\delta$ como una "función de valor real": si se evalúa con funciones que se retocan en un solo punto, se pueden obtener resultados erróneos.

La razón por la que esto no suele ser un problema en física es el paradigma de "todas las funciones son continuas". Porque mientras cada elemento de $L^2(\mathbb{R})$ contiene muchas funciones, cada una de las cuales difiere sólo en un conjunto nulo (por ejemplo, sólo en puntos discretos), siempre hay como máximo un único continuo dicha función. Así que, $\tilde\delta$ es en realidad está bien definida como una función $L^2(\mathbb{R}) \cap \mathcal{C}^0(\mathbb{R}) \to \mathbb{R}$ . Por otra parte, eso no es un espacio de Hilbert, pero ciertamente es un subconjunto real de uno, así que los físicos lo están haciendo bien.


Para ser precisos (como me recuerda Hans), el espacio dual en cuestión es sólo el espacio de <em><a href="https://en.wikipedia.org/wiki/Bounded_operator" rel="nofollow noreferrer">limitado </a>funcionales lineales </em>(o, de forma equivalente, los funcionales lineales continuos, aunque me gustaría señalar que la continuidad en los funcionales no debe confundirse con la continuidad en las funciones correspondientes). Por tanto, aunque $\tilde\delta$ era un funcional bien definido - que de hecho se puede hacer restringiéndose más a la <a href="https://en.wikipedia.org/wiki/Sobolev_space" rel="nofollow noreferrer">$H^1$ Espacio de Sobolev </a>en el que cada clase de equivalencia tiene exactamente un miembro continuo - no se podría aplicar Riesz, porque el funcional no estaría acotado, es decir, se podría construir una secuencia de $L^2$ funciones que tienen todos los mismos $L^2$ pero dan resultados de crecimiento infinito de $\tilde\delta$ .

0voto

Acccumulation Puntos 13

Puede ser útil hacer una analogía con CS (suponiendo que esté lo suficientemente familiarizado con CS para entender esto, por supuesto). El uso "normal" de las funciones es proporcionar un valor de evaluación: f(x) = algo. Llamas a f, le pasas el parámetro x, y obtienes algún valor de vuelta. Sin embargo, de forma más general/abstracta, puedes pensar en una función como un objeto con un método de evaluación: f.evaluate(x) = algo. Dependiendo del contexto en el que se utilicen las funciones, puede haber más métodos: f.taylor(n), por ejemplo, puede devolver el enésimo coeficiente de la expansión de Taylor. Si estás haciendo combinatoria, esto podría ser todo lo que te interesa: si f es una función generadora, entonces puede que no te importe en absoluto a qué se evalúa realmente. Y una vez que dejes de preocuparte por eso, entonces habrá objetos que sí tienen lo que te interesa, pero no tienen lo que tiene una función "verdadera". Por ejemplo, si f.taylor(n) = n n entonces su radio de convergencia es cero, y por tanto es indefinido en todas partes menos en cero. Más precisamente, su evaluación es indefinido en todas partes menos en cero. Sus coeficientes de Taylor siguen estando perfectamente definidos.

Así que podemos tener una clase que se ha generalizado a partir del concepto tradicional de "función", pero ahora ya no se requiere que tenga algo integral de ese concepto. Ahora, consideremos cómo se utilizan las funciones en la probabilidad. Generalmente, una función de probabilidad no se utiliza por su método de evaluación; la PDF da la "densidad" de probabilidad en un punto, pero la "masa" de probabilidad real en cualquier punto es cero. Una FDP sólo tiene una masa de probabilidad distinta de cero en un conjunto que no sea de medida cero. Así que lo que realmente necesitamos es un método CDF: f.cdf(a,b) da la CDF sobre el intervalo (a,b). Así que de nuevo tenemos una clase que se parece mucho a las "funciones", y a menudo se da en forma de función, por ejemplo, f(x) = e -x . Mientras estemos en esta clase abstracta parecida a una función, no hay problema en incluir la "función" delta. Pero cuando lo tratamos como si fuera realmente una función, eso puede causar problemas.

Entonces, ¿cuáles son algunos casos en los que puede causar problemas? Bueno, obviamente intentar evaluarlo a 0 causa un problema. Como no es continua, intercambiar límites que involucren la función delta puede causar problemas. Aplicar el Teorema Fundamental del Cálculo causa problemas (el FTC básicamente dice que la derivada de la integral es igual a la función original). Tomar la Transformada de Fourier no causa problemas en sí misma, pero suponiendo que el resultado estará en L 2 sí. En general, hay que tener más cuidado al hacer la normalización cuando se trata de funciones delta.

0voto

Martin Puntos 2000

Estoy muy contento de considerar $\delta$ como una función, sin tener que complicarse con el análisis funcional que aleja la intuición. Hasta que tropiece con el cuadrado $(\delta(x))^2$ que es un objeto sospechoso: de hecho, una sola búsqueda en Internet revela problemas . $^{[1]}$

También hay otra cuestión: si $\phi\colon \mathbb R^n\to \mathbb R$ Me encantaría considerar $\delta(\phi(x_1\ldots x_n))$ . Ese es otro caso en la que el $\delta$ "no se comporta en absoluto como una función.


Nota [1]. A un nivel más realista, Nota 2 de esta respuesta muestra que $\delta$ no puede considerarse como un elemento de $L^2(\mathbb R)$ ni siquiera en un sentido "débil", por lo que $\delta(x)^2$ debería tener una integral infinita, para empezar.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X