20 votos

¿Qué significa la transformación de Fourier en el contexto de las imágenes?

Esto es claramente una ecuación muy importante con toneladas de propiedades que veo que sube mucho en la literatura de procesamiento de imágenes, pero no entiendo por qué esta ecuación es importante, y lo que dice.

¿Qué significa realmente significa y por qué es el Fourier transforma tan frecuente en el tratamiento de la imagen?

15voto

Todd Puntos 173

En el procesamiento de sonido, la transformada de Fourier tiene una físicamente significado intuitivo. Un sonido o de la función $f : [0,b] \rightarrow [-1,1]$ puede ser representado como un trigonométrica de la serie. Y cada término de la serie corresponde a una frecuencia que usted percibe. Muchos de los efectos (como el filtrado, reverb, etc.) tienen una interpretación en el dominio de la frecuencia, que es útil para el análisis. Desafortunadamente, la interpretación física no es tan simple cuando empezamos a hablar sobre las imágenes. Pero en la analítica, la utilidad de las transferencias.

Si estamos hablando de escala de grises, a continuación, una imagen es simplemente una función de $f : [0,1]^2 \rightarrow [0,1]$. Se toma un punto en el cuadrado de $[0,1]\times[0,1]$ y produce un valor entre 0 y 1, la intensidad. La transformada de Fourier sólo dice que podemos representar esta función en el dominio de la frecuencia utilizando una contables base de las funciones trigonométricas. Dicen desea desenfocar una imagen; esto corresponde a un filtro de paso bajo en el dominio de la frecuencia. El siguiente enlace muestra muchos ejemplos de transformadas de Fourier de las imágenes, da una explicación de la interpretación física (que yo no pretendo comprender en su totalidad) y muestra ejemplos de los básicos de procesamiento de imágenes. Este sitio web muestra más ejemplos ilustrativos.

Otro uso muy importante de (variantes) de la 2d-transformada de Fourier es la compresión de la imagen. La página de Wikipedia para el codec JPEG enumera las funciones de base se utiliza para representar las imágenes.

Por último, tenga en cuenta que si estamos hablando de una imagen RGB puede representar la imagen utilizando la transformada de Fourier de cada componente de color.

2voto

MathematicalOrchid Puntos 2113

La transformada de Fourier en cualquier transformada de Fourier - divide una señal en "frecuencias", y las medidas de la amplitud y la alineación de cada una de las frecuencias.

En el caso del sonido, estas son las frecuencias audibles que se puede escuchar. Pero en el caso de una imagen, las cosas son menos evidentes. La matemática es todavía el mismo, pero es más difícil para envolver su cerebro alrededor.

La transformada de Fourier de las medidas de "frecuencias espaciales" en la imagen. Si usted se imagina barras horizontales o verticales de color que se repita en diferentes velocidades, estas son las "frecuencias" que la transformada de Fourier es la medición. Como una señal de sonido, una imagen con mucho, el balanceo, el suave color transiciones contiene muchas frecuencias bajas, mientras que uno con abruptos cambios en el color posee muchas de las frecuencias altas.

La transformada de Fourier, por tanto, tiene un par de usos en el procesamiento de la imagen. Se me ocurren dos:


En primer lugar, al cambio de la señal, su espectro, obviamente, los cambios así. Cuando usted toma una fotografía y la cámara se mueve, se obtiene una imagen borrosa. No es obvio cómo se podría tratar de "unblur" esta imagen. Pero, cuando hablamos sobre el espectro de la imagen, un desenfoque es simplemente un filtrado paso-bajo de operación. En principio, si usted deshacer el filtro, usted podría unblur la imagen.

(Obviamente, esa es la teoría. En la práctica, no es así de simple...)

Un montón de otras cosas interesantes que se podrían hacer a una imagen son bastante complicadas, en términos de lo que sucede a los píxeles individuales, pero muy simple en términos de cómo los cambios del espectro. Así que el uso de la transformada de Fourier para obtener un espectro es un paso obvio.


Alternativamente, la transformada de Fourier es útil para la compresión de la imagen. Si guarda el individuo colores de los píxeles con menos precisión, la imagen sólo se ve como algunos horribles gráficos por ordenador a partir de la década de 1980. Pero si guarda el espectro con menos precisión, la imagen sólo se pone ligeramente borrosa, que es mucho menos molesto.

Haciendo un análisis sofisticado de la forma en que el cerebro humano procesa los datos de la imagen, se puede estimar que las frecuencias en una determinada imagen son "los más importantes", y la tienda de aquellos con alta precisión, mientras que tirar a la basura cualquier "menos importantes" frecuencias. Esta es la forma en JPEG y amigos de trabajo.

0voto

Caroline Puntos 21

No puedo ver de donde a escribir un comentario, así que me voy a tener que darle mis ideas como una respuesta (mis disculpas para el Intercambio de la Pila de mods).

La transformada de Fourier de extractos de lo mucho que la señal es "como" una sinusoide con longitud de onda particular. Cada color es una longitud de onda diferente (que supongo que significa qué tan rápido los fotones de luz son oscilantes, o algo así). Por lo tanto, supongo que la transformación es la parte de la señal de entrada se compone de diferentes longitudes de onda o colores. HTH.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X