ARTICLE

方差

方差 (Variance) 方差 (Variance) 是概率论和统计学中最核心的离散度量指标，由统计学家罗纳德·费希尔 (Ronald Fisher) 在其1918年的开创性论文中正式引入并命名，用于量化一组数据的波动程度或一个随机变量分布的散布特征。直观上，方差衡量的是各数据点与其算术平均数（或期望值）之间偏差的平方的平均值。方差越大，表明数据分布越分散

浏览 77 更新 2025-10-25

方差 (Variance)

方差 (Variance) 是概率论和统计学中最核心的离散度量指标，由统计学家罗纳德·费希尔 (Ronald Fisher) 在其1918年的开创性论文中正式引入并命名，用于量化一组数据的波动程度或一个随机变量分布的散布特征。直观上，方差衡量的是各数据点与其算术平均数（或期望值）之间偏差的平方的平均值。方差越大，表明数据分布越分散，个体间差异越显著；方差越小，数据越紧密聚集在均值周围；方差为零意味着所有观测值完全相同，不存在任何变异。方差的符号通常记为 $\sigma^2$ （总体方差）或 $s^2$ （样本方差）。由于计算过程中对偏差进行了平方，方差的单位是原始数据单位的平方——例如，若数据为身高（单位米），则方差的单位为平方米。这一单位特性使得方差在直观解释上存在困难，因此实践中更常使用其平方根，即标准差 (Standard Deviation)，后者的单位与原始数据一致。

计算公式与核心逻辑

方差的计算遵循"偏差平方求平均"的基本思路。进行平方操作有两个关键原因：第一，原始偏差 $\sum(x_i - \mu)$ 恒为零，因为正负偏差相互抵消，平方操作消除了符号，使所有偏差值非负；第二，平方赋予较大偏差不成比例的高权重——一个远离均值两倍的点，其平方偏差是距离均值仅一倍的点的四倍，这使得方差对离群值 (Outlier) 和极端波动高度敏感。

总体方差适用于我们拥有完整总体数据的情形，公式为：

\sigma^2 = \frac{1}{N}\sum_{i=1}^{N} (x_i - \mu)^2

其中 $N$ 为总体观测总数， $\mu$ 为总体平均数。该值描述了总体本身的真实离散程度。

样本方差则是在仅有样本数据时，用于估计未知总体方差 $\sigma^2$ 的统计量。其公式与总体方差的关键区别在于分母使用 $n-1$ 而非 $n$ ：

s^2 = \frac{1}{n-1}\sum_{i=1}^{n} (x_i - \bar{x})^2

这一调整称为贝塞尔校正 (Bessel's Correction)，其理论基础是自由度 (Degrees of Freedom) 的概念。具体而言，当我们用样本数据计算样本均值 $\bar{x}$ 时，已经消耗了一个自由度——在已知 $\bar{x}$ 和任意 $n-1$ 个观测值后，第 $n$ 个观测值就被完全确定。因此，真正能够"自由"变动的偏差只有 $n-1$ 个。若直接使用 $n$ 作为分母，得到的估计量会系统性地低估真实的总体方差（即是一个有偏估计量）；除以 $n-1$ 则使得 $s^2$ 成为 $\sigma^2$ 的无偏估计量，满足 $E[s^2] = \sigma^2$ 。当样本量 $n$ 很大时， $n$ 与 $n-1$ 的差异可以忽略，但在小样本分析中，这一校正至关重要。

随机变量的方差

在概率论框架下，方差被严格定义为随机变量 $X$ 与其期望值 $\mu = E[X]$ 之间偏差平方的期望：

\operatorname{Var}(X) = E[(X - \mu)^2] = E[X^2] - (E[X])^2

展开后的第二种形式 $E[X^2] - (E[X])^2$ 在实际计算中尤为便捷——只需分别计算平方的期望和期望的平方，然后相减即可。

对于离散随机变量，其概率质量函数为 $p(x_i) = P(X = x_i)$ ，方差计算为：

\operatorname{Var}(X) = \sum_{i} (x_i - \mu)^2 \, p(x_i)

对于连续随机变量，其概率密度函数为 $f(x)$ ，求和替换为积分：

\operatorname{Var}(X) = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) \, dx

这一积分形式在解析推导中频繁出现，是理论统计学的标准工具。

基本性质

方差具有一系列在统计推断和金融建模中被广泛使用的代数性质。设 $X, Y$ 为随机变量， $a, b$ 为常数：

非负性： $\operatorname{Var}(X) \ge 0$ ，等号成立当且仅当 $X$ 以概率 1 取某个常数值，即不存在任何随机波动。
平移不变性： $\operatorname{Var}(X + a) = \operatorname{Var}(X)$ 。将所有数据同时加上一个常数，仅改变数据中心位置，数据之间的相对距离和离散程度保持不变，因此方差不变。
缩放性质： $\operatorname{Var}(aX) = a^2 \operatorname{Var}(X)$ 。将数据乘以常数 $a$ 会以 $a^2$ 的比例缩放方差。常数的方差为零： $\operatorname{Var}(a) = 0$ 。
和的方差： $\operatorname{Var}(X + Y) = \operatorname{Var}(X) + \operatorname{Var}(Y) + 2\operatorname{Cov}(X, Y)$ 。当 $X$ 与 $Y$ 独立时，协方差 $\operatorname{Cov}(X, Y) = 0$ ，方差可直接相加——这一可加性意味着独立风险源的方差能够线性聚合，是现代投资组合理论风险分解的数学基础。

应用与局限

方差是描述统计学中最基本的离散度量，也是推断统计学的基石：样本方差支撑着假设检验（t检验检验单样本或两样本均值差异、F检验比较两个方差是否相等、方差分析 (ANOVA) 将总变异分解为组间和组内来源）以及置信区间的构建。在金融经济学中，现代投资组合理论 (Modern Portfolio Theory) 将资产收益率的方差作为风险的核心量化指标：投资者通过选择相关性较低的资产构建组合，利用分散化效应降低组合的整体方差，从而在不牺牲预期收益的前提下控制风险。在工业质量控制中，监控产品关键指标（如零件长度、重量）的方差可以评估生产过程的稳定性和一致性——方差越低，质量越可靠。

方差的主要局限有两点。第一，单位不可直观解释——若资产收益率以百分比计量，方差单位是"百分比的平方"，缺乏经济含义，因此实务中几乎总是改用标准差进行报告和沟通。第二，平方操作赋予极端值过大权重，一个异常数据点即可显著拉高方差，有时会扭曲对数据整体离散程度的判断。在数据包含严重离群值或分布呈现厚尾特征时，四分位距 (Interquartile Range, IQR) 或平均绝对偏差 (Mean Absolute Deviation) 等稳健离散度量可能是更可靠的选择。尽管如此，方差凭借其良好的数学性质——特别是独立变量下方差的可加性——依然是概率论和统计学中不可替代的基础概念。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。