🎓 总站 🏠 本课目录 01 图像基础 02 空间滤波 03 频率滤波 04 彩色处理 05 神经网络 06 表征学习 07 Transformer 08 CNN
视觉计算 · 第3章

频率域滤波

傅里叶变换 / DFT / FFT · 频谱与相角 · 卷积定理 · 理想/巴特沃思/高斯低通与高通滤波 · 振铃效应。

📚 学习进度
0%

🎯学习目标

  • 理解正交/酉变换、傅里叶变换及反变换(一维/二维、连续/离散 DFT);
  • 掌握傅里叶变换性质:平移、旋转、周期性、共轭对称、可分离性;
  • 理解频谱(幅度)与相角的含义,频谱表灰度、相角表形状;
  • 掌握卷积定理与 FFT 的思想及复杂度(M²→M·log₂M);
  • 掌握三种低通(理想/巴特沃思/高斯)与三种高通滤波器及振铃效应;
  • 理解空间域与频率域滤波的对应关系。

1正交变换基础

一组正交函数集合 U={u₀,u₁,…} 可作为信号分析的"基轴";归一化后每个为单位向量。完备正交集合可把连续函数 f(x) 作正交分解(系数 aₙ=⟨f, uₙ⟩)。

变换正交条件
正交变换(实矩阵)U·Uᵀ=I(行/列正交),反变换用转置
酉变换(复矩阵)A·A*ᵀ=I(A* 为复共轭),正交变换是酉变换的特例

二维酉变换核可分离(通常取 A=B):先做行变换再做列变换。反变换中 a*(x,y) 是基图像,F(u,v) 是权因子,图像可表示为 N² 个基图像的加权和。点击卡片翻转查看要点:

📏

正交性

Orthogonality
基函数互相正交(内积为0),U·Uᵀ=I。保证变换可逆、能量守恒
🧩

完备性

Completeness
基集合足够"全",任意函数都能由基线性表出。正交+完备 → 可用于信号分析
✂️

可分离性

Separability
二维变换核可拆成两个一维核(A=B):先行后列。这是二维 FFT 加速的基础

2傅里叶变换与 DFT ⭐

周期函数可表示成正弦与余弦之和(傅里叶级数)。变换公式:

一维连续 FT:  F(u) = ∫ f(x) e^{-j2πux} dx
一维离散 DFT: F(u) = Σ_{x=0}^{M-1} f(x) e^{-j2πux/M}   (u=0…M-1)
反变换 IDFT: f(x) = (1/M) Σ F(u) e^{+j2πux/M}
二维 DFT:     F(u,v) = Σ_x Σ_y f(x,y) e^{-j2π(ux/M + vy/N)}
              (u,v 频率变量;x,y 空间变量;离散后 f、F 均周期)
💡 正交变换视角DFT 可写成矩阵乘 g=Hf,H 的每一行是一个基向量 e^{-j2πux/N};变换值 = f 与该基向量的内积。二维 DFT = U·F·Vᵀ(先列变换再行变换)。

3傅里叶变换的性质

性质要点
平移空域乘指数项 → 频域中心平移;f(x,y) 的平移不改变频谱幅值(只改相位)。用 (-1)^(x+y) 乘 f 可把频谱原点移到 (M/2,N/2) 中心
分配律加法满足分配律,对乘法不满足
尺度变换空域放大 → 频域缩小(及幅度缩放)
旋转f 旋转 θ,则 F 也旋转相同角度 θ
周期性二维 DFT 在两方向都无限周期
共轭对称实函数 f 的 FT 满足 F(-u,-v)=F*(u,v),频谱关于原点偶对称
可分离性二维 FT = 先对每行做一维 FT,再对每列做一维 FT(或先列后行)
⭐ 平移与相位对图像做平移,幅度谱 |F(u,v)| 不变,变化的只是相位谱。这与"频谱表强度、相角表位置/形状"一致。

4频谱与相角

极坐标表示:F(u,v) = |F(u,v)| · e^{jφ(u,v)}
幅度/频谱:  |F(u,v)| = √[R²(u,v) + I²(u,v)]
功率谱:     P(u,v) = R² + I²
相角/相位谱: φ(u,v) = arctan[I(u,v)/R(u,v)]
原点处:     F(0,0) = M·N·平均灰度  (频谱最大成分=直流分量)
未中心化(亮点在4角) ×(-1)^(x+y) 中心化 → 中心化频谱(低频居中) 中心 = 低频 = 平均灰度越往外 = 越高频高频 = 边缘/噪声等突变
图1 · 频谱中心化:低频(慢变化/平均灰度)集中于中心,高频(边缘/噪声)在外围
💡 频谱 vs 相角实验表明:仅用频谱重构 → 表达灰度(强度);仅用相角重构 → 表达形状(轮廓)。相角携带了图像的结构信息。

5卷积定理与 FFT ⭐

卷积定理

空间域卷积  ⇔  频率域乘积:   f(x,y) * h(x,y)  ⇔  F(u,v)·H(u,v)
空间域乘积  ⇔  频率域卷积
为避免周期延拓造成的"缠绕错误",需对 f、h 补零(0 填充):
两等大 M×N 阵列要求 P≥2M-1, Q≥2N-1(一维 P≥A+B-1)

快速傅里叶变换 FFT

直接 DFT 复数乘加次数正比于 ;FFT 利用奇偶分解(设 M=2ⁿ)只需 M·log₂M 次运算。

F(u)   = F_even(u) + F_odd(u)·W_M^u      u=0…K-1  (K=M/2)
F(u+K) = F_even(u) - F_odd(u)·W_M^u      其中 W_M=e^{-j2π/M}
思想:把 M 点 DFT 拆成两个 M/2 点 DFT,递归分解到单点。
⭐ FFT 加速比若 M=1024≈10³,直接法约需 10⁶ 次计算,FFT 仅约 10⁴ 次,比值约 1:100。二维 FFT 借助可分离性由两次一维 FFT 完成。

相关性:f 与 h 的相关用于模板匹配——若匹配,相关值在对应位置达到最大;自相关是复数模平方的反变换。

6频率域滤波的步骤

  1. 对 M×N 图像 f(x,y) 补零,得到 P×Q 图像 f_p;
  2. 用 (-1)^(x+y) 乘输入图像,进行中心化
  3. 计算 DFT,得到 F(u,v);
  4. 用滤波器函数 H(u,v) 逐元素乘以 F(u,v)
  5. 计算结果的反 DFT;
  6. 取结果的实部
  7. 再用 (-1)^(x+y) 乘,取消中心化乘数,得到输出。
💡 关键H 与 F 的相乘是逐元素的;F 一般为复数、H 一般为实数。当 H 为零相移滤波器时不改变变换的相位。陷波滤波器令 F(0,0)=0 会使整体平均灰度下降。

7频率域平滑(低通)滤波器 ⭐

低通滤波器使低频通过、衰减高频 → 图像模糊(边缘/噪声等高频被滤除),对应空域均值滤波。D(u,v) 为到频率矩形中心的距离,D₀ 为截止频率。

滤波器传递函数 H(u,v)特点
理想低通 ILPFD≤D₀ 时为 1,否则为 0急剧截断;振铃严重
巴特沃思低通 BLPF(n阶)1 / [1 + (D/D₀)^{2n}]过渡平滑;D=D₀ 时 H=0.5;介于理想与高斯之间
高斯低通 GLPFe^{-D²/(2D₀²)}最平滑;D=D₀ 时降到最大值 0.607;无振铃
D(u,v) → H D₀ 理想 ILPF 巴特沃思 高斯 GLPF
图2 · 三种低通滤波器横截面:理想急剧截断,高斯最平滑,巴特沃思居中
⭐ 振铃效应(Ringing)理想低通在空间域 h(x,y) 呈圆环波纹(中心波瓣 + 外侧小波瓣),卷积后在边缘附近产生明暗交替的"波纹",即振铃。D₀ 越小模糊越强、振铃越明显。BLPF(n=1 无振铃,n 越大越接近 ILPF)和 GLPF(无振铃)可缓解。

应用:字符识别(模糊桥接断裂字符)、印刷出版(柔化人脸细纹)、卫星/航空图像(模糊细节保留大特征)。

8频率域锐化(高通)滤波器 ⭐

高通滤波器使高频通过、衰减低频 → 突出边缘等细节(图像锐化),对应空域梯度/拉普拉斯。通常 H_HP = 1 - H_LP

滤波器传递函数 H(u,v)特点
理想高通 IHPFD≤D₀ 时为 0,否则为 1振铃明显(D₀=15、30 尤甚)
巴特沃思高通 BHPF1 / [1 + (D₀/D)^{2n}]比 IHPF 平滑得多
高斯高通 GHPF1 - e^{-D²/(2D₀²)}比 BHPF、IHPF 更平滑

频率域拉普拉斯:H(u,v) = -(u²+v²),中心化后 H(u,v)=-[(u-M/2)²+(v-N/2)²];增强图像 g = f - ∇²f。由于 F(0,0) 被置 0,高通结果较暗、几乎无平滑灰度细节,可对滤波器加常数(高频加强)改进。

D(u,v) → D₀ 理想高通 高斯高通
图3 · 高通滤波器:阻低频、通高频,与低通互补(H_HP=1-H_LP)

9空间域与频率域的关系

  • 空间域和频率域中的滤波器组成傅里叶变换对:已知频域滤波器反变换可得空域滤波器,反之亦然。
  • 滤波在频率域更直观(直接看通带/阻带),但空间域常用更小的模板
  • 高斯函数特性:H(u) 轮廓越宽(σ 大)则 h(x) 轮廓越窄;σ→∞ 时 H 趋于常量、h 趋于冲激。
  • 频率域低通越窄 → 滤除低频越多 → 图像越模糊;对应空域低通越宽、模板越大。
  • 可用高斯函数之差构造高通(DoG)等复杂滤波器。
⭐ 核心纽带卷积定理是空间域滤波与频率域滤波之间的纽带:空间域卷积 = 频率域逐元素相乘后反变换。

重点例题

例题1:判断低通/高通效果 某频率域滤波后图像变得模糊、边缘减弱,判断滤波器类型。
解:模糊说明高频(边缘、噪声)被衰减、低频通过 ⇒ 是低通滤波器。反之若图像被锐化、突出边缘则为高通
例题2:FFT 加速比 M=1024 时,直接 DFT 与 FFT 的运算量之比约为?
解:直接法 ∝ M²=1024²≈10⁶;FFT ∝ M·log₂M=1024×10≈10⁴。比值 ≈ 1:100
例题3:为什么理想低通有振铃而高斯没有? 答:理想低通在频域是陡峭矩形(急剧截断),其空间域反变换 h(x) 是 sinc 型函数,带有正负交替的外侧波瓣,卷积后在边缘产生明暗波纹(振铃)。高斯滤波器的反变换仍是高斯(非负、无波瓣),故无振铃。
例题4:平移对频谱的影响 把图像整体平移后,幅度谱会变化吗?
答:不会。由平移性质,空域平移只给频域乘一个相位因子 e^{-j2π(…)},幅值 |F(u,v)| 保持不变,改变的是相位谱。

🎯自测(点击展开)

傅里叶变换在原点 F(0,0) 等于什么?
F(0,0)=M·N·平均灰度,是频谱最大成分(直流分量)。
低通滤波器对图像有什么效果?为什么?
使图像模糊:低通让低频通过、衰减高频,而边缘/噪声等细节在高频。
三种低通滤波器中哪个无振铃、哪个振铃最严重?
高斯低通无振铃;理想低通振铃最严重;巴特沃思居中(阶数越高越像理想)。
FFT 把 DFT 的复杂度从多少降到多少?
从 ∝M² 降到 ∝M·log₂M。
对图像做平移,幅度谱会改变吗?
不会,只改变相位谱(平移性质)。
为什么频率域卷积前要对图像补零?
DFT 隐含周期延拓,补零避免相邻周期数据造成的缠绕错误(P≥2M-1)。

📝强化题库

选择题点选即时判分;填空题输入后"检查"或"显示答案"。

已答 0/0答对 0正确率
已答 0/0答对 0