ARTICLE
频率
频率 (Frequency) 频率(Frequency)是一个基础且核心的科学概念,用于描述一个重复性事件在单位时间内发生的次数。它在统计学、物理学、工程学、经济学等众多领域中都扮演着至关重要的角色。根据应用场景的不同,频率的定义和测量方式略有差异,但其核心思想——量化重复发生的程度——是相通的。 统计学中的频率 在统计学和数据分析中,频率指的是在一个数据集
频率 (Frequency)
频率(Frequency)是一个基础且核心的科学概念,用于描述一个重复性事件在单位时间内发生的次数。它在统计学、物理学、工程学、经济学等众多领域中都扮演着至关重要的角色。根据应用场景的不同,频率的定义和测量方式略有差异,但其核心思想——量化重复发生的程度——是相通的。
统计学中的频率
在统计学和数据分析中,频率指的是在一个数据集中,某个特定数值、类别或事件出现的次数。这是描述性统计分析的基石,也是从原始数据中提取信息的首要步骤。
绝对频率 (Absolute Frequency)
绝对频率,也常简称为频数,是指数据集中某一特定值或某一类别出现的具体次数。它是一个非负整数。
- 定义:对于一个包含 个观测值的样本,其中类别 出现的次数记为 ,则 就是类别 的绝对频率。
- 性质:所有类别的绝对频率之和等于样本的总观测数,即: \[ \sum_{i=1}^{k} f_i = N \] 其中 是不同类别的总数。
示例:假设投掷一个骰子20次,得到的点数序列为 。那么点数"4"出现的绝对频率是6,点数"1"的绝对频率是2。
相对频率 (Relative Frequency)
相对频率是指某一类别的绝对频率与总观测次数的比值。它表示该类别在整个数据集中所占的比例或百分比,是频率概念从"计数"走向"比率"的关键一步。
- 定义:类别 的相对频率 的计算公式为: \[ p_i = \frac{f_i}{N} \] 其中 是类别 的绝对频率, 是总观测次数。
- 性质:相对频率的值介于0和1之间,即 ;所有类别的相对频率之和等于1,即 。
示例:在上述骰子例子中,总观测次数 。点数"4"的绝对频率 ,其相对频率为 (即30\%);点数"1"的相对频率为 (即10\%)。
相对频率是概率的一个重要估计量。根据大数定律(Law of Large Numbers),当随机试验的次数 足够大时,事件的相对频率会趋近于其理论概率。这一联系是频率学派(Frequentist)统计推断的哲学基础——概率被解释为无限次重复试验中相对频率的极限。
累积频率 (Cumulative Frequency)
累积频率是指从最低类别开始,到某个特定类别为止,所有类别的频率之和。它用于了解有多少观测值小于或等于某个特定值,是构造经验分布函数的基础。
- 定义:类别 的累积频率 是所有不大于类别 的类别的绝对频率之和: \[ F_i = \sum_{j=1}^{i} f_j \] 同样,累积相对频率定义为 。
- 应用:累积频率分布对于确定中位数、四分位数和百分位数等位置度量非常有用。给定累积相对频率分布,第 百分位数即为满足 的最小类别值。
示例:继续使用骰子数据,构建频率分布表如下:
\begin{tabular}{|c|c|c|c|c|} \hline 点数 () \& 绝对频率 () \& 相对频率 () \& 累积频率 () \& 累积相对频率 () \\ \hline 1 \& 2 \& 0.10 \& 2 \& 0.10 \\ 2 \& 3 \& 0.15 \& 5 \& 0.25 \\ 3 \& 3 \& 0.15 \& 8 \& 0.40 \\ 4 \& 6 \& 0.30 \& 14 \& 0.70 \\ 5 \& 3 \& 0.15 \& 17 \& 0.85 \\ 6 \& 3 \& 0.15 \& 20 \& 1.00 \\ \hline 总计 \& 20 \& 1.00 \& — \& — \\ \hline \end{tabular}
从表中可知,点数小于或等于4的累积频率是14(累积相对频率为0.70),即70\%的投掷结果不超过4点。
物理学与工程学中的频率
在物理学中,频率是描述波动(Wave)和振动(Oscillation)现象的核心物理量。它与周期、波长和能量之间存在简洁而深刻的数学关系。
- 定义:频率 指的是介质中的质点或场在单位时间内完成完整振动或变化的次数。它是周期 (完成一次完整振动所需的时间)的倒数: \[ f = \frac{1}{T} \]
- 单位:频率的国际标准单位是赫兹(Hertz),符号为Hz。1 Hz表示每秒发生一次重复事件。常用倍数单位包括kHz( Hz)、MHz( Hz)和GHz( Hz)。
应用示例:
- 声波(Sound Wave):频率决定了声音的音高(Pitch)。高频声波听起来尖锐(如短笛),低频声波听起来低沉(如大鼓)。人类的听觉范围大约在20 Hz到20,000 Hz之间,低于20 Hz的称为次声波,高于20 kHz的称为超声波。
- 电磁波(Electromagnetic Wave):频率决定了电磁波的类型和能量。从低频的无线电波,到微波、红外线、可见光、紫外线、X射线,再到高频的伽马射线,它们的本质区别就在于频率的不同。光子能量与频率的关系由普朗克公式 给出,其中 为普朗克常数。
- 交流电(Alternating Current, AC):市电的频率(如中国的50 Hz或美国的60 Hz)描述了电流方向每秒钟改变的周期次数。这一频率的选择涉及发电效率、输电损耗和历史标准的综合权衡。
角频率 (Angular Frequency)
在处理旋转和振动问题时,尤其是使用三角函数描述简谐运动时,使用角频率 更为方便。
- 定义:角频率表示单位时间内相位角的变化量,其单位是弧度/秒(rad/s): \[ \omega = 2\pi f = \frac{2\pi}{T} \] 乘以 是因为一个完整的周期对应于一个圆周的 弧度。简谐振动的位置函数可简洁地写为 。
- 优势:在使用复数表示和傅里叶分析时,角频率避免了公式中频繁出现 因子,使表达式更加简洁紧凑。
频率分析与应用
频率分析是研究数据或信号中不同频率成分及其强度的方法,广泛应用于从自然科学到社会科学的各个领域。
统计可视化与探索性分析
在统计学中,通过创建频率分布表、直方图(Histogram)、条形图(Bar Chart)或频率多边形(Frequency Polygon)来可视化数据的分布特征,是探索性数据分析(Exploratory Data Analysis, EDA)的第一步。这些可视化工具能够直观地揭示数据的集中趋势、离散程度、偏态和峰态等关键特征,为后续的统计建模提供方向性指导。
频谱分析 (Spectral Analysis)
在信号处理中,使用傅里叶变换(Fourier Transform)等数学工具,可以将一个复杂的时域信号(如声音、图像或经济时间序列)分解为其组成的正弦波频率成分。这一技术使得我们能够:
- 识别信号中的周期性模式和隐藏的节律;
- 滤除特定频段的噪声(如低通滤波、高通滤波和带通滤波);
- 实现数据压缩(如JPEG图像压缩和MP3音频压缩均基于频域分析)。
快速傅里叶变换(FFT)算法的发明(Cooley-Tukey, 1965)极大降低了频谱分析的计算复杂度,使其成为现代数字信号处理的基石。
经济学与金融中的应用
经济学家和金融分析师广泛使用频率分析:
- 商业周期分析:通过频谱分析识别宏观经济变量(GDP、失业率等)中的周期成分,区分短期波动、中期商业周期(通常3—8年)和长期趋势。
- 季节性调整:利用频率域方法(如X-13ARIMA-SEATS)从月度或季度经济数据中剔除季节性频率成分,得到更能反映经济基本面的季节调整序列。
- 金融市场的波动性:高频交易(High-Frequency Trading, HFT)利用毫秒甚至微秒级别的价格变动频率进行算法交易。已实现波动率(Realized Volatility)正是通过对高频收益率平方求和来估计低频波动率。
- 时间序列分析:自相关函数(ACF)和偏自相关函数(PACF)本质上衡量的是时间序列在不同滞后(即不同"频率"尺度)上的线性依赖结构,是ARIMA建模的核心诊断工具。
综上,频率作为一个概念,横跨了从离散计数到连续波动的广泛领域,是理解和分析周期性、重复性现象的不可或缺的工具。无论是在统计表中计数事件的发生次数,还是在频谱仪上观察信号的频率分量,频率都提供了统一的量化语言——衡量"重复"的尺度。