ARTICLE

方差

方差 (Variance) 方差 (Variance) 是概率论和统计学中最核心的离散度量指标,由统计学家罗纳德·费希尔 (Ronald Fisher) 在其1918年的开创性论文中正式引入并命名,用于量化一组数据的波动程度或一个随机变量分布的散布特征。直观上,方差衡量的是各数据点与其算术平均数(或期望值)之间偏差的平方的平均值。方差越大,表明数据分布越分散

浏览 77 更新 2025-10-25

方差 (Variance)

方差 (Variance) 是概率论统计学中最核心的离散度量指标,由统计学家罗纳德·费希尔 (Ronald Fisher) 在其1918年的开创性论文中正式引入并命名,用于量化一组数据的波动程度或一个随机变量分布的散布特征。直观上,方差衡量的是各数据点与其算术平均数(或期望值)之间偏差的平方的平均值。方差越大,表明数据分布越分散,个体间差异越显著;方差越小,数据越紧密聚集在均值周围;方差为零意味着所有观测值完全相同,不存在任何变异。方差的符号通常记为 σ2\sigma^2(总体方差)或 s2s^2(样本方差)。由于计算过程中对偏差进行了平方,方差的单位是原始数据单位的平方——例如,若数据为身高(单位米),则方差的单位为平方米。这一单位特性使得方差在直观解释上存在困难,因此实践中更常使用其平方根,即标准差 (Standard Deviation),后者的单位与原始数据一致。

计算公式与核心逻辑

方差的计算遵循"偏差平方求平均"的基本思路。进行平方操作有两个关键原因:第一,原始偏差 (xiμ)\sum(x_i - \mu) 恒为零,因为正负偏差相互抵消,平方操作消除了符号,使所有偏差值非负;第二,平方赋予较大偏差不成比例的高权重——一个远离均值两倍的点,其平方偏差是距离均值仅一倍的点的四倍,这使得方差对离群值 (Outlier) 和极端波动高度敏感。

总体方差适用于我们拥有完整总体数据的情形,公式为:

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N} (x_i - \mu)^2

其中 NN 为总体观测总数,μ\mu总体平均数。该值描述了总体本身的真实离散程度。

样本方差则是在仅有样本数据时,用于估计未知总体方差 σ2\sigma^2 的统计量。其公式与总体方差的关键区别在于分母使用 n1n-1 而非 nn

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n} (x_i - \bar{x})^2

这一调整称为贝塞尔校正 (Bessel's Correction),其理论基础是自由度 (Degrees of Freedom) 的概念。具体而言,当我们用样本数据计算样本均值 xˉ\bar{x} 时,已经消耗了一个自由度——在已知 xˉ\bar{x} 和任意 n1n-1 个观测值后,第 nn 个观测值就被完全确定。因此,真正能够"自由"变动的偏差只有 n1n-1 个。若直接使用 nn 作为分母,得到的估计量会系统性地低估真实的总体方差(即是一个有偏估计量);除以 n1n-1 则使得 s2s^2 成为 σ2\sigma^2无偏估计量,满足 E[s2]=σ2E[s^2] = \sigma^2。当样本量 nn 很大时,nnn1n-1 的差异可以忽略,但在小样本分析中,这一校正至关重要。

随机变量的方差

在概率论框架下,方差被严格定义为随机变量 XX 与其期望值 μ=E[X]\mu = E[X] 之间偏差平方的期望:

Var(X)=E[(Xμ)2]=E[X2](E[X])2\operatorname{Var}(X) = E[(X - \mu)^2] = E[X^2] - (E[X])^2

展开后的第二种形式 E[X2](E[X])2E[X^2] - (E[X])^2 在实际计算中尤为便捷——只需分别计算平方的期望和期望的平方,然后相减即可。

对于离散随机变量,其概率质量函数p(xi)=P(X=xi)p(x_i) = P(X = x_i),方差计算为:

Var(X)=i(xiμ)2p(xi)\operatorname{Var}(X) = \sum_{i} (x_i - \mu)^2 \, p(x_i)

对于连续随机变量,其概率密度函数f(x)f(x),求和替换为积分:

Var(X)=(xμ)2f(x)dx\operatorname{Var}(X) = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) \, dx

这一积分形式在解析推导中频繁出现,是理论统计学的标准工具。

基本性质

方差具有一系列在统计推断和金融建模中被广泛使用的代数性质。设 X,YX, Y 为随机变量,a,ba, b 为常数:

  • 非负性Var(X)0\operatorname{Var}(X) \ge 0,等号成立当且仅当 XX 以概率 1 取某个常数值,即不存在任何随机波动。
  • 平移不变性Var(X+a)=Var(X)\operatorname{Var}(X + a) = \operatorname{Var}(X)。将所有数据同时加上一个常数,仅改变数据中心位置,数据之间的相对距离和离散程度保持不变,因此方差不变。
  • 缩放性质Var(aX)=a2Var(X)\operatorname{Var}(aX) = a^2 \operatorname{Var}(X)。将数据乘以常数 aa 会以 a2a^2 的比例缩放方差。常数的方差为零:Var(a)=0\operatorname{Var}(a) = 0
  • 和的方差Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)\operatorname{Var}(X + Y) = \operatorname{Var}(X) + \operatorname{Var}(Y) + 2\operatorname{Cov}(X, Y)。当 XXYY 独立时,协方差 Cov(X,Y)=0\operatorname{Cov}(X, Y) = 0,方差可直接相加——这一可加性意味着独立风险源的方差能够线性聚合,是现代投资组合理论风险分解的数学基础。

应用与局限

方差是描述统计学中最基本的离散度量,也是推断统计学的基石:样本方差支撑着假设检验t检验检验单样本或两样本均值差异、F检验比较两个方差是否相等、方差分析 (ANOVA) 将总变异分解为组间和组内来源)以及置信区间的构建。在金融经济学中,现代投资组合理论 (Modern Portfolio Theory) 将资产收益率的方差作为风险的核心量化指标:投资者通过选择相关性较低的资产构建组合,利用分散化效应降低组合的整体方差,从而在不牺牲预期收益的前提下控制风险。在工业质量控制中,监控产品关键指标(如零件长度、重量)的方差可以评估生产过程的稳定性和一致性——方差越低,质量越可靠。

方差的主要局限有两点。第一,单位不可直观解释——若资产收益率以百分比计量,方差单位是"百分比的平方",缺乏经济含义,因此实务中几乎总是改用标准差进行报告和沟通。第二,平方操作赋予极端值过大权重,一个异常数据点即可显著拉高方差,有时会扭曲对数据整体离散程度的判断。在数据包含严重离群值或分布呈现厚尾特征时,四分位距 (Interquartile Range, IQR) 或平均绝对偏差 (Mean Absolute Deviation) 等稳健离散度量可能是更可靠的选择。尽管如此,方差凭借其良好的数学性质——特别是独立变量下方差的可加性——依然是概率论和统计学中不可替代的基础概念。