视觉计算 · 第3章

频率域滤波

傅里叶变换 / DFT / FFT · 频谱与相角 · 卷积定理 · 理想/巴特沃思/高斯低通与高通滤波 · 振铃效应。

📚 学习进度

🎯学习目标

理解正交/酉变换、傅里叶变换及反变换（一维/二维、连续/离散 DFT）；
掌握傅里叶变换性质：平移、旋转、周期性、共轭对称、可分离性；
理解频谱（幅度）与相角的含义，频谱表灰度、相角表形状；
掌握卷积定理与 FFT 的思想及复杂度（M²→M·log₂M）；
掌握三种低通（理想/巴特沃思/高斯）与三种高通滤波器及振铃效应；
理解空间域与频率域滤波的对应关系。

1正交变换基础

通俗理解：想象你要描述一个复杂的信号（比如声音或图像），正交变换就像用一组"互相垂直的坐标轴"去分解它——每根轴捕获信号的一个独立成分，互不干扰。这就是正交函数集合 U={u₀,u₁,…} 的作用。归一化后每个为单位向量。完备正交集合可把连续函数 f(x) 作正交分解（系数 aₙ=⟨f, uₙ⟩）。

变换	正交条件
正交变换（实矩阵）	$U \cdot U^T=I$（行/列正交），反变换用转置
酉变换（复矩阵）	$A \cdot A^{T}=I$（$A^$ 为复共轭），正交变换是酉变换的特例

二维酉变换核可分离（通常取 $A=B$）：先做行变换再做列变换。反变换中 $a^*(x,y)$ 是基图像，$F(u,v)$ 是权因子，图像可表示为 $N^2$ 个基图像的加权和。点击卡片翻转查看要点：

📏

正交性

Orthogonality

基函数互相正交（内积为0），U·Uᵀ=I。保证变换可逆、能量守恒

🧩

完备性

Completeness

基集合足够"全"，任意函数都能由基线性表出。正交+完备 → 可用于信号分析

✂️

可分离性

Separability

二维变换核可拆成两个一维核（A=B）：先行后列。这是二维 FFT 加速的基础

💡 通俗理解：正交变换 = 换一种"坐标系" 类比：描述一个点的位置

笛卡尔坐标：(x, y) = (3, 4)
极坐标：(r, θ) = (5, 53°)

同一个点，两种描述方式
正交变换就是"换一种描述方式"

为什么要换？
  • 有些问题在新坐标系下更容易解决
  • 就像有些题用极坐标更简单

正交的含义：
  • 基向量互相垂直
  • 就像 x轴和 y轴垂直
  • 保证变换不丢失信息

可分离性：
  • 二维变换可以拆成两个一维变换
  • 先对每行做变换，再对每列做变换
  • 这样计算更快（O(N²logN) vs O(N⁴)）

2傅里叶变换与 DFT ⭐

类比理解：傅里叶变换就像"棱镜分光"——棱镜把白光分解成不同颜色的光谱，傅里叶变换把复杂的信号分解成不同频率的正弦波。知道每种频率的"强度"和"相位"，就能完美重建原始信号。

傅里叶变换：把复杂信号拆成简单正弦波

周期函数可表示成正弦与余弦之和（傅里叶级数）。以下是变换公式——看不懂公式没关系，关键是理解"把信号拆成不同频率的正弦波"：

一维连续 FT：  $$F(u) = \int f(x) e^{-j2\pi ux} dx$$
一维离散 DFT： $$F(u) = \sum_{x=0}^{M-1} f(x) e^{-j2\pi ux/M}   \quad (u=0 \ldots M-1)$$
反变换 IDFT： $$f(x) = \frac{1}{M} \sum F(u) e^{+j2\pi ux/M}$$
二维 DFT：     $$F(u,v) = \sum_x \sum_y f(x,y) e^{-j2\pi (ux/M + vy/N)}$$
              （$u,v$ 频率变量；$x,y$ 空间变量；离散后 $f$、$F$ 均周期）

💡 正交变换视角DFT 可写成矩阵乘 g=Hf，H 的每一行是一个基向量 e^{-j2πux/N}；变换值 = f 与该基向量的内积。通俗地说：每个频率分量通过"点积"来衡量原始信号与该频率正弦波的"相似程度"。二维 DFT = U·F·Vᵀ（先列变换再行变换）。

💡 通俗理解：傅里叶变换 = "频率分析器" 类比：听音乐

一首歌 = 很多不同频率的声音叠加
  • 低频：鼓点、贝斯
  • 高频：吉他、人声

傅里叶变换 = 把这首歌"分解"成各个频率成分
  • 告诉你每种频率的"强度"和"相位"

在图像中：
  • 低频：大面积平滑区域（天空、墙壁）
  • 高频：边缘、噪声、细节

傅里叶变换做的事：
  • 把图像从"空间域"转换到"频率域"
  • 告诉你图像中每种频率的"强度"

为什么要转换到频率域？
  • 在频率域处理某些问题更方便
  • 比如去除周期性噪声（只需要去掉某个频率）
  • 比如模糊（只需要去掉高频）

公式看不懂没关系：
  • 关键是理解"分解"的思想
  • 就像把白光分解成彩虹

💡 通俗理解：傅里叶变换

核心意思：

傅里叶变换 = 把复杂信号拆成简单正弦波，就像棱镜把白光分解成彩虹

举个例子：

一个复杂信号可以拆成多个正弦波：

原始信号（复杂）：
    f(x) = 3sin(2π×1x) + 2sin(2π×3x) + 1sin(2π×5x)

分解后：
    频率1：振幅3（最强）
    频率3：振幅2（中等）
    频率5：振幅1（最弱）

在图像中：
    低频（中心）= 大片平滑区域（天空、墙壁）
    高频（外围）= 边缘、噪声、细节

生活类比：

傅里叶变换：像棱镜分光
频谱：像成分表，告诉你每种频率有多少
相角：像位置信息，告诉你每种频率在哪里

为什么这样设计：

因为在频率域处理某些问题更方便：
  • 去除周期性噪声（只需要去掉某个频率）
  • 模糊（只需要去掉高频）
  • 锐化（只需要增强高频）

3傅里叶变换的性质

性质	要点
平移	空域乘指数项 → 频域中心平移；$f(x,y)$ 的平移不改变频谱幅值（只改相位）。用 $(-1)^{x+y}$ 乘 $f$ 可把频谱原点移到 $(M/2,N/2)$ 中心
分配律	对加法满足分配律，对乘法不满足
尺度变换	空域放大 → 频域缩小（及幅度缩放）
旋转	$f$ 旋转 $\theta$，则 $F$ 也旋转相同角度 $\theta$
周期性	二维 DFT 在两方向都无限周期
共轭对称	实函数 $f$ 的 FT 满足 $F(-u,-v)=F^*(u,v)$，频谱关于原点偶对称
可分离性	二维 FT = 先对每行做一维 FT，再对每列做一维 FT（或先列后行）

⭐ 平移与相位对图像做平移，幅度谱 $|F(u,v)|$ 不变，变化的只是相位谱。这与"频谱表强度、相角表位置/形状"一致。

4频谱与相角

极坐标表示：$$F(u,v) = |F(u,v)| \cdot e^{j\varphi(u,v)}$$
幅度/频谱：  $$|F(u,v)| = \sqrt{R^2(u,v) + I^2(u,v)}$$
功率谱：     $$P(u,v) = R^2 + I^2$$
相角/相位谱： $$\varphi(u,v) = \arctan[I(u,v)/R(u,v)]$$
原点处：     $$F(0,0) = M \cdot N \cdot \text{平均灰度}$$  （频谱最大成分=直流分量）

通俗理解：频谱图中间是低频（图像的整体亮度和平滑区域），外围是高频（边缘、噪声等突变细节）。乘以 (-1)^(x+y) 就是把频谱的"原点"从四个角落移到正中央，方便观察。

频谱中心化：低频移到中间，高频在外围

图1 · 频谱中心化：低频（慢变化/平均灰度）集中于中心，高频（边缘/噪声）在外围

💡 频谱 vs 相角实验表明：仅用频谱重构 → 表达灰度（强度）；仅用相角重构 → 表达形状（轮廓）。相角携带了图像的结构信息。

🍽️ 通俗理解：频谱图 = 图像的"成分表" 把图像想象成一道菜：

频谱（幅度谱）= 每种食材放了多少
  • 低频（中心）= 主食放了多少（米饭、面条）
  • 高频（外围）= 调料放了多少（盐、辣椒）

相角 = 每种食材放在哪里
  • 决定了最终菜的"形状"

实验证明：
  • 只用频谱重建 → 能还原"整体亮度"，但形状不对
  • 只用相角重建 → 能还原"形状轮廓"，但亮度不对

一句话：频谱管"强度"，相角管"位置"

💡 通俗理解：为什么要中心化？ 问题：原始频谱的低频在四个角落
  • 看起来不方便
  • 不符合直觉

解决：乘以 (-1)^(x+y)
  • 把低频移到中心
  • 高频自然就在外围

效果：
  • 中心 = 低频 = 平均亮度 = 大片平滑区域
  • 外围 = 高频 = 边缘、噪声、细节

类比：
  • 原始频谱：把地图的"北"放在角落
  • 中心化后：把"北"放在中间
  • 更符合我们的观察习惯

怎么读懂频谱图？
  • 中心亮：图像整体偏亮
  • 中心暗：图像整体偏暗
  • 外围亮：图像有很多边缘/细节
  • 外围暗：图像比较平滑

💡 通俗理解：频谱中心化

核心意思：

频谱中心化 = 把低频从角落移到中间，更符合直觉

举个例子：

原始频谱（未中心化）：
    低频在四个角落：
    [低] [ ] [ ] [低]
    [ ]  [ ] [ ] [ ]
    [ ]  [ ] [ ] [ ]
    [低] [ ] [ ] [低]

中心化后：
    低频在中心：
    [ ]  [ ] [ ] [ ]
    [ ]  [高] [高] [ ]
    [ ]  [高] [高] [ ]
    [ ]  [ ] [ ] [ ]

中心化方法：
    乘以 (-1)^(x+y)

生活类比：

原始频谱：像把地图的"北"放在角落
中心化后：像把"北"放在中间
更符合我们的观察习惯

为什么这样设计：

怎么读懂频谱图？
  • 中心亮：图像整体偏亮
  • 中心暗：图像整体偏暗
  • 外围亮：图像有很多边缘/细节
  • 外围暗：图像比较平滑

5卷积定理与 FFT ⭐

卷积定理

空间域卷积  $$\Leftrightarrow$$  频率域乘积：   $$f(x,y) * h(x,y)  \Leftrightarrow  F(u,v) \cdot H(u,v)$$
空间域乘积  $$\Leftrightarrow$$  频率域卷积
为避免周期延拓造成的"缠绕错误"，需对 $f$、$h$ 补零（0 填充）：
两等大 $$M \times N$$ 阵列要求 $$P \geq 2M-1, Q \geq 2N-1$$（一维 $$P \geq A+B-1$$）

快速傅里叶变换 FFT

直接 DFT 复数乘加次数正比于 M²；FFT 利用奇偶分解（设 M=2ⁿ）只需 M·log₂M 次运算。

$$F(u)   = F_{\text{even}}(u) + F_{\text{odd}}(u) \cdot W_M^u      \quad u=0 \ldots K-1  \quad (K=M/2)$$
$$F(u+K) = F_{\text{even}}(u) - F_{\text{odd}}(u) \cdot W_M^u      \quad$$ 其中 $$W_M=e^{-j2\pi/M}$$
思想：把 M 点 DFT 拆成两个 M/2 点 DFT，递归分解到单点。

⭐ FFT 加速比若 $M=1024 \approx 10^3$，直接法约需 $10^6$ 次计算，FFT 仅约 $10^4$ 次，比值约 1:100。二维 FFT 借助可分离性由两次一维 FFT 完成。

💡 通俗理解：FFT快速傅里叶变换

核心意思：

FFT = 快速计算DFT的算法，把O(N²)降到O(N log N)

举个例子：

计算1024个点的DFT：

直接DFT：
    计算量：N² = 1024² = 1,048,576 次复数乘法
    时间：假设每次乘法1ns，需要约1ms

FFT：
    计算量：N log₂N = 1024 × 10 = 10,240 次复数乘法
    时间：约10μs

加速比：1,048,576 / 10,240 ≈ 100倍！

FFT的原理（分治法）：

把N点DFT拆成两个N/2点DFT：
    F(u) = F_even(u) + W_N^u × F_odd(u)

其中：
    - F_even：偶数点的DFT
    - F_odd：奇数点的DFT
    - W_N^u：旋转因子

递归分解，直到只有1个点（1点DFT就是它自己）

生活类比：

直接DFT：像一个人算1000道题
FFT：像10个人每人算100道题，然后合并结果
分工合作，效率大大提高

为什么FFT这么快？

因为利用了DFT的对称性和周期性，避免了重复计算。

相关性：f 与 h 的相关用于模板匹配——若匹配，相关值在对应位置达到最大；自相关是复数模平方的反变换。

💡 通俗理解：卷积定理 = "两个域的对应关系" 核心公式：
空间域卷积 ⟺ 频率域乘积

意思是：
  • 在空间域做卷积 = 在频率域做乘法
  • 两种方式结果一样

为什么这个定理重要？

直接卷积：
  • 计算量 = O(N × M²)（N是图像大小，M是模板大小）
  • 模板越大，计算越慢

频率域乘法：
  • 计算量 = O(N log N)（FFT的复杂度）
  • 和模板大小无关

所以：
  • 小模板（3×3、5×5）：直接卷积更快
  • 大模板（比如模糊整个图像）：频率域更快

补零的作用：
  • DFT假设图像是周期的
  • 不补零会导致"缠绕错误"
  • 补零让周期之间有间隔，避免干扰

补零规则：
  • P ≥ 2M - 1（M是图像尺寸）
  • 通常补到2的幂次（方便FFT）

💡 通俗理解：卷积定理

核心意思：

卷积定理 = 空间域卷积 = 频率域乘法，两种方式结果一样

举个例子：

对图像做 3×3 均值滤波：

方法1：直接卷积（空间域）
    计算量：O(N × M²) = O(N × 9)
    N是图像大小，M是模板大小
    模板越大，计算越慢

方法2：频率域乘法
    1. 对图像做FFT：O(N log N)
    2. 对模板做FFT：O(N log N)
    3. 两者相乘：O(N)
    4. 做IFFT：O(N log N)
    总计算量：O(N log N)

对比：
    方法        计算量          适用场景
    直接卷积    O(N × M²)      小模板（3×3、5×5）
    频率域      O(N log N)     大模板

生活类比：

直接卷积：像用小刷子刷墙，刷子越小越慢
频率域：像用大刷子刷墙，不管刷子大小都差不多快

为什么这样设计：

为什么需要补零？
DFT假设图像是周期的，不补零会导致"缠绕错误"。
补零规则：P ≥ 2M - 1

6频率域滤波的步骤

对 $M \times N$ 图像 $f(x,y)$ 补零，得到 $P \times Q$ 图像 $f_p$；
用 $(-1)^{x+y}$ 乘输入图像，进行中心化；
计算 DFT，得到 $F(u,v)$；
用滤波器函数 $H(u,v)$ 逐元素乘以 $F(u,v)$；
计算结果的反 DFT；
取结果的实部；
再用 $(-1)^{x+y}$ 乘，取消中心化乘数，得到输出。

💡 关键$H$ 与 $F$ 的相乘是逐元素的；$F$ 一般为复数、$H$ 一般为实数。当 $H$ 为零相移滤波器时不改变变换的相位。陷波滤波器令 $F(0,0)=0$ 会使整体平均灰度下降。

7频率域平滑（低通）滤波器 ⭐

低通滤波器使低频通过、衰减高频 → 图像模糊（边缘/噪声等高频被滤除），对应空域均值滤波。$D(u,v)$ 为到频率矩形中心的距离，$D_0$ 为截止频率。

滤波器	传递函数 $H(u,v)$	特点
理想低通 ILPF	$D \leq D_0$ 时为 1，否则为 0	急剧截断；振铃严重
巴特沃思低通 BLPF（$n$阶）	$1 / [1 + (D/D_0)^{2n}]$	过渡平滑；$D=D_0$ 时 $H=0.5$；介于理想与高斯之间
高斯低通 GLPF	$e^{-D^2/(2D_0^2)}$	最平滑；$D=D_0$ 时降到最大值 0.607；无振铃

图2 · 三种低通滤波器横截面：理想急剧截断，高斯最平滑，巴特沃思居中

⭐ 振铃效应（Ringing）理想低通在空间域 h(x,y) 呈圆环波纹（中心波瓣 + 外侧小波瓣），卷积后在边缘附近产生明暗交替的"波纹"，即振铃。D₀ 越小模糊越强、振铃越明显。BLPF（n=1 无振铃，n 越大越接近 ILPF）和 GLPF（无振铃）可缓解。

🔍 通俗理解：滤波器 = 图像的"筛子" 低通滤波器（只让低频通过）：
  • 效果：图像变模糊
  • 原理：去掉了边缘、噪声这些"高频成分"
  • 就像：用毛玻璃看东西
  • 用途：美颜磨皮、去噪

高通滤波器（只让高频通过）：
  • 效果：只剩边缘轮廓
  • 原理：去掉了大面积平滑区域这些"低频成分"
  • 就像：只看素描画的线条
  • 用途：边缘检测、锐化

一句话：低通 = 模糊，高通 = 找边

🪞 通俗理解：振铃 = 图像边缘出现"波纹" 为什么会这样？

理想低通滤波器：
  • 在频域是"方方正正"的矩形
  • 但反变换到空间域后，变成了"波浪形"
  • 卷积后就在边缘留下波纹

就像：
  • 你用一把很硬的刷子刷墙
  • 墙面上会留下刷痕

解决办法：
  • 用高斯滤波器（边缘是圆滑的，没有振铃）
  • 就像用软毛刷，刷出来很平滑

💡 通俗理解：理想低通滤波器的振铃效应

核心意思：

振铃效应 = 理想低通滤波后，边缘出现波纹状的伪影

举个例子：

原图：一个方块
    0 0 0 0 0 0 0 0
    0 0 0 0 0 0 0 0
    0 0 1 1 1 1 0 0
    0 0 1 1 1 1 0 0
    0 0 1 1 1 1 0 0
    0 0 1 1 1 1 0 0
    0 0 0 0 0 0 0 0
    0 0 0 0 0 0 0 0

理想低通滤波后：
    0 0 0 0 0 0 0 0
    0 0.1 0.2 0.3 0.3 0.2 0.1 0
    0 0.2 0.8 0.9 0.9 0.8 0.2 0
    0 0.3 0.9 1.0 1.0 0.9 0.3 0
    0 0.3 0.9 1.0 1.0 0.9 0.3 0
    0 0.2 0.8 0.9 0.9 0.8 0.2 0
    0 0.1 0.2 0.3 0.3 0.2 0.1 0
    0 0 0 0 0 0 0 0

问题：边缘出现了明暗交替的波纹！

为什么会振铃？

理想低通在频域是"方方正正"的矩形
反变换到空间域变成sinc函数（波浪形）
sinc函数有正负交替的波瓣
卷积后就在边缘留下波纹

三种滤波器的振铃对比：

滤波器      振铃程度    原因
理想低通    严重        频域突变
巴特沃思    中等        有一定过渡
高斯低通    无          频域平滑

生活类比：

理想低通：像用硬刷子刷墙，会留刷痕
高斯低通：像用软毛刷，刷出来很平滑
振铃：像刷痕，是工具留下的痕迹

如何避免振铃？

使用高斯低通或巴特沃思低通，避免使用理想低通。

应用：字符识别（模糊桥接断裂字符）、印刷出版（柔化人脸细纹）、卫星/航空图像（模糊细节保留大特征）。

低通 vs 高通滤波：保留不同频率成分

💡 通俗理解：三种低通滤波器 = 三种"模糊方式" 1. 理想低通滤波器（ILPF）= "一刀切"
  • 低频完全保留，高频完全去掉
  • 就像用一把很硬的刀切蛋糕
  • 优点：简单直接
  • 缺点：会有"振铃"（边缘出现波纹）

2. 巴特沃思低通滤波器（BLPF）= "渐变过渡"
  • 低频保留，高频衰减，中间有过渡
  • 就像用一把有弧度的刀切蛋糕
  • 优点：比理想平滑
  • 缺点：阶数越高越像理想滤波器

3. 高斯低通滤波器（GLPF）= "最平滑"
  • 过渡最平滑，没有突变
  • 就像用一把很软的刀切蛋糕
  • 优点：没有振铃
  • 缺点：模糊效果可能不够强

振铃效应的原因：
  • 理想滤波器在频率域是"方方正正"的
  • 反变换到空间域后变成"波浪形"
  • 卷积后就在边缘留下波纹

选择建议：
  • 需要强模糊：用理想低通（但要注意振铃）
  • 需要平滑模糊：用高斯低通（推荐）
  • 介于两者之间：用巴特沃思

💡 通俗理解：低通 vs 高通滤波

核心意思：

低通 = 模糊 = 去掉高频，高通 = 找边 = 去掉低频

举个例子：

原图：有一辆车在马路上

低通滤波后：
    - 车的边缘变模糊
    - 马路变平滑
    - 噪声被去除
    - 效果：像近视眼看世界

高通滤波后：
    - 只剩下车的轮廓
    - 马路消失（大面积平滑区域）
    - 噪声也被保留
    - 效果：像素描画的线条

三种滤波器对比：
    类型        特点          振铃
    理想低通    一刀切        严重
    巴特沃思    渐变过渡      中等
    高斯低通    最平滑        无

生活类比：

低通滤波：像用毛玻璃看东西
高通滤波：像只看素描画的线条
理想滤波：像用硬刷子刷墙，会留刷痕
高斯滤波：像用软毛刷，刷出来很平滑

为什么这样设计：

为什么低通会模糊？
因为边缘、细节都是高频成分，去掉高频就等于去掉了边缘。

8频率域锐化（高通）滤波器 ⭐

高通滤波器使高频通过、衰减低频 → 突出边缘等细节（图像锐化），对应空域梯度/拉普拉斯。通常 $H_{HP} = 1 - H_{LP}$。

滤波器	传递函数 $H(u,v)$	特点
理想高通 IHPF	$D \leq D_0$ 时为 0，否则为 1	振铃明显（$D_0=15$、30 尤甚）
巴特沃思高通 BHPF	$1 / [1 + (D_0/D)^{2n}]$	比 IHPF 平滑得多
高斯高通 GHPF	$1 - e^{-D^2/(2D_0^2)}$	比 BHPF、IHPF 更平滑

频率域拉普拉斯：$H(u,v) = -(u^2+v^2)$，中心化后 $H(u,v)=-[(u-M/2)^2+(v-N/2)^2]$；增强图像 $g = f - \nabla^2 f$。由于 $F(0,0)$ 被置 0，高通结果较暗、几乎无平滑灰度细节，可对滤波器加常数（高频加强）改进。

图3 · 高通滤波器：阻低频、通高频，与低通互补（H_HP=1-H_LP）

💡 通俗理解：高通 = 找边缘 = 锐化 高通滤波器 = 1 - 低通滤波器
  • 低通让低频通过（模糊）
  • 高通让高频通过（找边缘）

效果：
  • 低频被去掉（大面积平滑区域消失）
  • 高频被保留（边缘、噪声、细节）

三种高通滤波器：
  1. 理想高通（IHPF）：一刀切，有振铃
  2. 巴特沃思高通（BHPF）：渐变过渡
  3. 高斯高通（GHPF）：最平滑

高通结果的特点：
  • 通常很暗（因为去掉了低频=平均亮度）
  • 只有边缘处有值
  • 需要增强才能看清

增强方法：
  • 加权叠加：g = f + c × HP(f)
  • f 是原图，HP(f) 是高通结果
  • c 是增强系数

频率域拉普拉斯：
  • H(u,v) = -(u² + v²)
  • 也是高通滤波器
  • 可以用来做图像锐化

💡 通俗理解：高通滤波详解

核心意思：

高通 = 保留高频（边缘/细节） = 去掉低频（平滑区域） = 锐化/找边

举个例子：

原图：有一辆车在马路上

高通滤波后：
    - 只剩下车的轮廓线条
    - 马路消失（大面积平滑区域被去掉）
    - 噪声也被保留（噪声也是高频）

高通结果通常很暗：
    因为去掉了低频 = 去掉了平均亮度
    只有边缘处有值，其余接近黑色

增强方法：
    g = f + c × HP(f)
    f = 原图，HP(f) = 高通结果
    c = 增强系数（控制边缘强度）

生活类比：

高通滤波：像只看素描画的线条
原图 + 高通 = 像给照片描边，更清晰
高通结果很暗 = 像在黑板上用白粉笔画线

为什么这样设计：

高通滤波器 H_HP = 1 - H_LP，与低通互补。
频率域拉普拉斯 H(u,v) = -(u²+v²) 也是高通，
可以用来做图像锐化和边缘检测。

9空间域与频率域的关系

空间域和频率域中的滤波器组成傅里叶变换对：已知频域滤波器反变换可得空域滤波器，反之亦然。
滤波在频率域更直观（直接看通带/阻带），但空间域常用更小的模板。
高斯函数特性：$H(u)$ 轮廓越宽（$\sigma$ 大）则 $h(x)$ 轮廓越窄；$\sigma \to \infty$ 时 $H$ 趋于常量、$h$ 趋于冲激。
频率域低通越窄 → 滤除低频越多 → 图像越模糊；对应空域低通越宽、模板越大。
可用高斯函数之差构造高通（DoG）等复杂滤波器。

💡 通俗理解：频域与空域的对应关系

核心意思：

频域和空域是同一信号的两种描述方式，就像一个人有两个名字

举个例子：

高斯函数的对应关系：

空域：h(x) = e^(-x²/2σ²)
    - σ越大，h(x)越宽（越模糊）
    - σ越小，h(x)越窄（越清晰）

频域：H(u) = e^(-u²/2σ_u²)
    - σ_u越大，H(u)越宽（保留更多高频）
    - σ_u越小，H(u)越窄（去掉更多高频）

关系：σ × σ_u = 常数
    - 空域越宽 → 频域越窄（越模糊）
    - 空域越窄 → 频域越宽（越清晰）

实际应用：

空域高斯模糊：
    - 用大的σ做卷积
    - 等价于在频域用窄的高斯滤波器

频域低通滤波：
    - 用小的D₀截止高频
    - 等价于在空域用宽的模板卷积

生活类比：

空域：像看一个人的外貌
频域：像看一个人的内在特质
同一个人，两种描述方式，但本质相同

为什么要知道这个对应关系？

因为在某个域处理更方便时，可以转到那个域去处理。

⭐ 核心纽带卷积定理是空间域滤波与频率域滤波之间的纽带：空间域卷积 = 频率域逐元素相乘后反变换。

⭐重点例题

例题1：判断低通/高通效果某频率域滤波后图像变得模糊、边缘减弱，判断滤波器类型。
解：模糊说明高频（边缘、噪声）被衰减、低频通过 ⇒ 是低通滤波器。反之若图像被锐化、突出边缘则为高通。

例题2：FFT 加速比 $M=1024$ 时，直接 DFT 与 FFT 的运算量之比约为？
解：直接法 $\propto M^2=1024^2 \approx 10^6$；FFT $\propto M \cdot \log_2 M=1024 \times 10 \approx 10^4$。比值 $\approx$ 1:100。

例题3：为什么理想低通有振铃而高斯没有？答：理想低通在频域是陡峭矩形（急剧截断），其空间域反变换 h(x) 是 sinc 型函数，带有正负交替的外侧波瓣，卷积后在边缘产生明暗波纹（振铃）。高斯滤波器的反变换仍是高斯（非负、无波瓣），故无振铃。

例题4：平移对频谱的影响把图像整体平移后，幅度谱会变化吗？
答：不会。由平移性质，空域平移只给频域乘一个相位因子 $e^{-j2\pi(\ldots)}$，幅值 $|F(u,v)|$ 保持不变，改变的是相位谱。

🎯自测（点击展开）

傅里叶变换在原点 F(0,0) 等于什么？

F(0,0)=M·N·平均灰度，是频谱最大成分（直流分量）。

低通滤波器对图像有什么效果？为什么？

使图像模糊：低通让低频通过、衰减高频，而边缘/噪声等细节在高频。

三种低通滤波器中哪个无振铃、哪个振铃最严重？

高斯低通无振铃；理想低通振铃最严重；巴特沃思居中（阶数越高越像理想）。

FFT 把 DFT 的复杂度从多少降到多少？

从 ∝M² 降到 ∝M·log₂M。

对图像做平移，幅度谱会改变吗？

不会，只改变相位谱（平移性质）。

为什么频率域卷积前要对图像补零？

DFT 隐含周期延拓，补零避免相邻周期数据造成的缠绕错误（P≥2M-1）。

📝强化题库

选择题点选即时判分；填空题输入后"检查"或"显示答案"。

已答 0/0答对 0正确率 —

已答 0/0答对 0