ARTICLE

数字信号

数字信号 (Digital Signal) 数字信号是指在时间上和幅度上都经过离散化的信号表示形式，与之相对的是连续时间、连续幅度的模拟信号。数字信号处理（Digital Signal Processing, DSP）利用数值计算的方法对这类信号进行分析、变换、滤波和压缩，是当代信息技术的核心支柱之一。从智能手机中的语音编解码、数码相机中的图像处理，到5G通

浏览 0 更新 2026-07-14

数字信号 (Digital Signal)

数字信号是指在时间上和幅度上都经过离散化的信号表示形式，与之相对的是连续时间、连续幅度的模拟信号。数字信号处理（Digital Signal Processing, DSP）利用数值计算的方法对这类信号进行分析、变换、滤波和压缩，是当代信息技术的核心支柱之一。从智能手机中的语音编解码、数码相机中的图像处理，到5G通信系统中的信道均衡、雷达系统中的目标检测，无不依赖数字信号理论与算法。

采样与量化

将模拟信号转换为数字信号需经历两个步骤：采样（Sampling）和量化（Quantization）。

采样是在时间轴上对连续信号 $x(t)$ 按固定间隔 $T_s$ 取值，得到离散时间序列 $x[n] = x(nT_s)$ 。奈奎斯特-香农采样定理（Nyquist-Shannon Sampling Theorem）是采样理论的基础：若信号最高频率分量为 $f_{\text{max}}$ ，则采样频率 $f_s = 1/T_s$ 必须满足 $f_s \geq 2f_{\text{max}}$ ，方可在理论上从离散样本中无失真地重建原始连续信号。若采样率不足，将产生混叠（Aliasing）现象——高频成分折叠至低频区间，造成不可恢复的信息损失。实际系统中常在前端放置抗混叠低通滤波器（Anti-Aliasing Filter）以抑制高于 $f_s/2$ 的频率成分。

量化是在幅度轴上将连续的采样值映射为有限个离散电平。设量化位数为 $b$ ，则共有 $2^b$ 个量化电平。量化过程引入的误差称为量化噪声（Quantization Noise），其功率约为 $\Delta^2/12$ （ $\Delta$ 为量化步长）。每增加 $1$ 位量化位数，信噪比约提升 $6.02$ dB。常见的量化位数为 $16$ 位（CD音质）、 $24$ 位（高分辨率音频）及 $8$ 位（早期电话语音）。

离散傅里叶变换与快速算法

离散傅里叶变换（Discrete Fourier Transform, DFT）是数字信号处理中最基本的数学工具，它将长度为 $N$ 的时域序列 $x[n]$ 变换为频域序列 $X[k]$ ：

X[k] = \sum_{n=0}^{N-1} x[n] e^{-j 2\pi kn/N}, \quad k = 0, 1, \dots, N-1

DFT 的直接计算复杂度为 $O(N^2)$ 。快速傅里叶变换（Fast Fourier Transform, FFT）——以 Cooley-Tukey 算法（1965）为代表——利用对称性和周期性将复杂度降至 $O(N \log N)$ ，使实时频谱分析成为可能。FFT 被誉为"二十世纪最重要的数值算法之一"，其应用涵盖频谱分析、卷积快速计算、OFDM（正交频分复用）调制解调等。

由 DFT 可从时域采样率 $f_s$ 和序列长度 $N$ 推导出频率分辨率 $\Delta f = f_s / N$ 。这一关系揭示了数字信号处理中的基本权衡：要提高频率分辨率，需增加采样点数 $N$ （即延长观测时间），同时保持足够高的采样率以避免混叠。

数字滤波器

数字滤波器通过对输入序列 $x[n]$ 执行线性卷积或差分方程运算来改变信号频谱。按冲激响应长度可分为两类：

有限冲激响应（Finite Impulse Response, FIR）滤波器的输出仅依赖于当前及过去的输入样本： $y[n] = \sum_{k=0}^{M} b_k x[n-k]$ 。FIR 滤波器天然稳定（所有极点位于原点），且可设计为严格线性相位——这一特性在需要保持波形相对延迟关系的应用中（如心电图分析、数据通信）极为重要。其设计方法包括窗函数法、频率采样法和 Parks-McClellan 最优等波纹法。

无限冲激响应（Infinite Impulse Response, IIR）滤波器的输出既依赖输入也依赖过去的输出： $y[n] = \sum_{k=0}^{M} b_k x[n-k] - \sum_{k=1}^{N} a_k y[n-k]$ 。IIR 滤波器可用较低的阶数实现陡峭的过渡带（相比 FIR 可节省数倍计算量），但可能不稳定，且相位响应通常为非线性。经典设计方法源自模拟滤波器的双线性变换（Bilinear Transform），包括 Butterworth（最平坦通带）、Chebyshev（等波纹通带/阻带）和 Elliptic（等波纹通带与阻带，最陡过渡带）三种原型。

数字信号处理的应用领域

音频处理

数字音频的核心操作包括采样率转换、均衡（Equalization）、动态范围压缩和回声消除。MP3、AAC 等感知音频编解码器利用心理声学模型（如听觉掩蔽效应）在保持主观音质的前提下大幅压缩数据量——这是信号处理与人类听觉生理学交叉的典范。语音识别（Automatic Speech Recognition, ASR）系统将数字语音信号作为输入，通过梅尔频率倒谱系数（MFCC）或滤波器组特征提取，结合隐马尔可夫模型或深度学习神经网络完成从声学信号到文本序列的映射。语音合成（Text-to-Speech, TTS）则逆向地将文本转换为波形，现代系统多采用基于神经网络的波形生成模型。

图像与视频

数字图像可视为二维数字信号 $x[m,n]$ 。JPEG 标准采用离散余弦变换（Discrete Cosine Transform, DCT）对 $8\times8$ 图像块进行变换域编码，利用人眼对高频细节不敏感的特性实现有损压缩。视频编码标准（H.264/H.265）在此基础上引入运动估计与补偿，利用帧间冗余进一步压缩码率。

通信系统

现代数字通信的物理层几乎完全由 DSP 实现：信道编码（如 LDPC、Turbo 码）、数字调制（QPSK、QAM）、匹配滤波、同步（载波恢复与符号定时）及自适应均衡。软件无线电（Software-Defined Radio, SDR）的理念是将尽可能多的信号处理环节移至数字域，通过可编程 DSP 或 FPGA 实现多种通信标准的灵活配置。

生物医学信号

心电图（ECG）和脑电图（EEG）是典型的生物医学数字信号。DSP 技术用于基线漂移去除、工频干扰抑制、QRS 波群检测及频谱分析。在功能性磁共振成像（fMRI）中，数字信号处理是去除生理噪声、检测脑区激活模式必不可少的环节。

雷达与声纳

雷达（Radar）和声纳（Sonar）系统通过发射已知波形并分析回波来探测目标。匹配滤波器（Matched Filter）是最大化信噪比的最优线性滤波器，其冲激响应为发射信号的时间反转共轭。脉冲压缩技术（Pulse Compression）通过线性调频（Chirp）或相位编码信号，在保持距离分辨率的同时降低峰值发射功率。自适应滤波（Adaptive Filtering）中的最小均方（LMS）算法和递归最小二乘（RLS）算法在杂波抑制、干扰对消和系统辨识中发挥关键作用。

核心直觉

数字信号处理的本质是用计算换信息：通过离散化将连续物理世界的无限信息压缩为有限的数字表示，再借助算法从中提取、增强或重构所需的信息内容。采样定理给出了尽可能少（但足量）的信息获取点数，量化理论决定了表示精度与存储代价之间的权衡，而 FFT 与数字滤波器则是高效处理这些离散信息的计算引擎。三者共同构成了从物理世界到数字世界的桥梁。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。