191 votos

¿Qué es la convolución intuitivamente?

Si la variable aleatoria $X$ tiene una distribución de probabilidad de $f(x)$ y la variable aleatoria $Y$ tiene una distribución de probabilidad $g(x)$ entonces $(f*g)(x)$ la convolución de $f$ y $g$ es la distribución de probabilidad de $X+Y$ . Esta es la única intuición que tengo de lo que significa la convolución.

¿Existen otros modelos intuitivos para el proceso de convolución?

0 votos

7 votos

En el artículo de la Wikipedia hay algunas buenas interpretaciones: es.wikipedia.org/wiki/Convolución#Aplicaciones

0 votos

10voto

Nate Eldredge Puntos 10670

Sólo para añadir otra respuesta:

Una heurística que me gusta es que la convolución es como medir la temperatura con un gran termómetro.

En una dimensión, imagine una cubeta llena de algún tipo de sustancia viscosa caliente, no necesariamente a una temperatura uniforme. Si $x$ es la posición a lo largo del canal (digamos, en cm), y $f(x)$ denotan la temperatura de la sustancia viscosa en la posición $x$ .

Ahora imagina que vas a introducir un termómetro para medir la temperatura de la sustancia viscosa. Su termómetro tiene un punto central, y en un desplazamiento $y$ desde el punto central, tiene una sensibilidad $g(y)$ . Por lo tanto, cuando se inserta el termómetro, la lectura de éste es una media de la temperatura real en los puntos alrededor del centro, ponderada por la sensibilidad del termómetro en cada punto.

Entonces $(f \ast g)(x)$ le indica la lectura del termómetro si lo introduce en la sustancia viscosa con su punto central en la posición $x$ .

Si $g = \delta$ es un delta de Dirac, esto corresponde a un termómetro "puntual" que mide la temperatura exactamente en el punto central, y así vemos que $f \ast \delta = f$ .

Esta analogía también tiene sentido en dimensiones superiores, por supuesto.

10voto

isomorphismes Puntos 250

Voy a dar dos respuestas. Juntas creo que construyen una intuición decente.

  1. El primero es algorítmico. Pienso en la convolución de dos listas $\vec{a} \ast \vec{b}$ en contraste con el producto punto $\vec{a} \cdot \vec{b}$ . De hecho, la convolución es la forma en que yo y otros estudiantes queríamos describir intuitivamente la multiplicación de vectores en mi primer intento de cálculo multivariable. El producto punto mapea $K^N \times K^N \to K^1$ pero $\ast: K^N \times K^N \to K^N$ . Por lo demás, se parecen en que multiplican los pares $a_i \cdot b_i$ . Pero donde el producto punto $\tt{reduce}$ s dimensionalidad sumando $\displaystyle \sum_i$ sobre las entradas, la convolución deja los productos en su lugar $\left( a_1 \cdot b_1, \ \ldots\ , \ a_N \cdot b_N \right)$ . En otras palabras, la convolución es la multiplicación por entradas que sus estudiantes de álgebra lineal querían hacer cuando les preguntó por primera vez cómo debían multiplicar dos matrices (excepto en vectores).

  2. La segunda es visual. Imagina una curva entrecortada, por ejemplo fed funds rate, historical
    (fuente: <a href="http://www.fedprimerate.com/fedfundsrate/effective-fed-funds-rate-1955-to-present-chart-graph.gif" rel="nofollow noreferrer">fedprimerate.com </a>)
    . Para suavizar esto, convolucionarías la serie de datos larga contra una lista mucho más corta. Para obtener la media semanal móvil se convulsionaría contra ${1 \over 5} \cdot \left[1 \ 1 \ 1 \ 1 \ 1 \right]$ (ceros implícitos a la izquierda y a la derecha-esto es convolucionar contra un $\mathrm{Rect}$ función). Para obtener la media móvil mensual serían 25. Si quieres convolucionar contra algo más suave que $\mathrm{Rect}$ se podría convulsionar contra un Gaussiano. El desenfoque gaussiano en 2D tiene este aspecto: Gaussian kernel smooth in 2D . Ahora me estoy saliendo de mi área de conocimiento pero creo que caja borrosa es la palabra de procesamiento de imágenes para la convolución contra un 2D $\mathrm{Rect}$ función, tal vez sólo significa con width=three unos: box blur
    (fuente: <a href="http://codecave.org/image-processing/gen_images/blur.png" rel="nofollow noreferrer">codecave.org </a>)
    . Tal vez con algunos conocimientos de informática puedas codificar un alisador con datos de tu elección.

Como postdata a esta respuesta, creo que la convolución gaussiana frente a la rectangular es en realidad un buen ejemplo para explicar a los no matemáticos cómo piensan los matemáticos sobre la "fealdad". Hay algo intuitivamente estúpido, incluso para un no matemático, en integrar contra algo como $$\begin{bmatrix}0&0&0&0&0\\ 0&0 & 1 & 0&0 \\ 0&1 & 1 & 1&0 \\ 0&0 & 1 & 0&0 \\ 0&0&0&0&0 \end{bmatrix}$$ cuando un círculo o una elipse sería una forma más lógica. También hay algo estúpido o feo o sin sentido o extraño en la integración contra $\left[ 0 \ \cdots\ 0 \ 0 \ 1 \ 1 \ 1 \ 0 \ 0 \ \cdots\ 0 \right]$ rect function pero, ¿cuál es la forma correcta de bajar "suavemente" o "lógicamente" a ambos lados? gaussian El debate sobre $\mathcal{F} \left( \exp(-x^2/2) \right) = \exp( -x^2/2)$ ....

9voto

Matt Miller Puntos 1829

Esto es realmente la continuación de la respuesta de John, pero es un poco largo para un comentario, así que pensé en escribirlo aquí para mayor claridad.

Digamos que tienes un semigrupo S, y tomas el espacio vectorial libre (complejo) que esto genera, llámalo $C^S$ . Por construcción/definición esto tiene una base distinguida, indexada por elementos del semigrupo; y como tenemos una estructura de semigrupo, eso significa que podemos multiplicar elementos de la base para obtener otros elementos de la base. Pero eso nos da ahora una forma de multiplicar dos vectores $a$ y $b$ juntos: escribir $a$ y $b$ como combinaciones lineales de elementos de la base, y luego definir su producto como la extensión (bi)lineal obvia de la multiplicación sobre elementos de la base. Si se hace todo esto a partir de $S={\bf Z}$ El grupo de los enteros, entonces lo que hemos hecho es definir la multiplicación de polinomios trigonométricos, o la convolución de secuencias finitamente soportadas.

Lo que me gusta de este punto de vista es que se generaliza inmediatamente a $l^1(S)$ y hace $l^1(S)$ en un álgebra de Banach. Si $S$ es un grupo topológico con una medida de Haar sobre él -- como la línea real con medida de Lebesgue -- entonces la misma idea nos da la estructura habitual del álgebra de Banach sobre $L^1(S)$ que en el caso $S={\bf R}$ es precisamente la convolución de funciones integrables en el sentido habitual.

(Llegados a este punto, alguien -a menudo yo- suele querer mencionar funtores olvidadizos de álgebras a espacios vectoriales y de semigrupos a conjuntos, pero eso probablemente sea un poco exagerado para la cuestión que nos ocupa).

9voto

Luke Puntos 798

Eche un vistazo aquí: es bastante útil.

http://answers.yahoo.com/question/index?qid=20070125163821AA5hyRX

7voto

Para complementar o complementar otras respuestas, puede valer la pena señalar que la propia pregunta difumina dos mecanismos sustancialmente diferentes. A saber, existe, en primer lugar, para cualquier representación de un grupo topológico $G$ en un espacio vectorial topológico $V$ una acción de funciones continuas con soporte compacto sobre $G$ en $V$ mediante integrales (por ejemplo, de Gelfand-Pettis o débiles) $f\cdot v=\int_G f(g)\cdot gv\,dg$ . Es importante señalar que esto no depende de $v$ estar en cualquier tipo de espacio-función natural. El segundo punto es que $f\cdot (g\cdot v)=(f*g)\cdot v$ , donde $*$ denota la convolución. Es decir, la noción de convolución está determinada externamente por ser lo que tiene que ser para que (por ejemplo) las funciones continuas con soporte compacto actúen (asociativamente) sobre cualquier espacio de representación.

Dependiendo de la perspectiva de cada uno, esto puede reducir algún elemento de aparente capricho en la "definición" de la convolución, ya que, en un contexto más amplio, _no_hay_elección_.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X