ARTICLE

方差 (Variance)

方差 (Variance) 方差 (Variance) 是概率论与数理统计中的一个核心概念，用于度量随机变量或一组数据的离散程度。它描述了数据点相对于其期望值（或均值）的分布广度，是衡量数据波动性的最重要指标之一。方差越大，表明数据分布越分散；方差越小，则表明数据越集中于均值附近。方差的平方根称为标准差，在实际应用中，标准差因其与原数据相同的量纲而更易于解释

浏览 0 更新 2026-05-25

方差 (Variance)

方差 (Variance) 是概率论与数理统计中的一个核心概念，用于度量随机变量或一组数据的离散程度。它描述了数据点相对于其期望值（或均值）的分布广度，是衡量数据波动性的最重要指标之一。方差越大，表明数据分布越分散；方差越小，则表明数据越集中于均值附近。方差的平方根称为标准差，在实际应用中，标准差因其与原数据相同的量纲而更易于解释。

一、方差的定义

1.1 随机变量的方差

设 $X$ 是一个随机变量，其期望值（均值）为 $\mu = \mathbb{E}[X]$ ，则 $X$ 的方差定义为随机变量与其均值偏差的平方的期望：

\operatorname{Var}(X) = \mathbb{E}\left[(X - \mu)^2\right]

这个定义表明，方差本质上是所有可能取值与均值距离平方的加权平均，权重由概率分布决定。

1.2 离散型随机变量的方差

若 $X$ 是离散型随机变量，其可能取值为 $x_1, x_2, \ldots, x_n$ ，对应的概率为 $p_1, p_2, \ldots, p_n$ ，则方差为：

\operatorname{Var}(X) = \sum_{i=1}^{n} p_i (x_i - \mu)^2

当所有概率相等时（即 $p_i = 1/n$ ），上式简化为：

\operatorname{Var}(X) = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2

1.3 连续型随机变量的方差

若 $X$ 是连续型随机变量，其概率密度函数为 $f(x)$ ，则方差为：

\operatorname{Var}(X) = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) \, dx

二、总体方差与样本方差

在实际应用中，必须区分总体方差和样本方差，这两者的定义和计算方式存在关键差异。

2.1 总体方差

总体方差是描述整个总体离散程度的参数，记作 $\sigma^2$ 。当总体均值 $\mu$ 已知时，总体方差的计算公式为：

\sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2

其中 $N$ 为总体大小。

2.2 样本方差

在实际研究中，我们往往只能获得样本数据。样本方差是总体方差的估计量，记作 $s^2$ 。为保证样本方差是总体方差的无偏估计，其计算公式中使用 $n-1$ 作为分母（即贝塞尔校正）：

s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2

其中 $n$ 为样本容量， $\bar{x}$ 为样本均值。这种调整的原因是样本均值 $\bar{x}$ 本身是从数据中计算得出的，导致自由度损失一个。

三、方差的计算简化公式

直接利用定义计算方差往往较为繁琐，实际计算中常使用以下简化公式：

\operatorname{Var}(X) = \mathbb{E}[X^2] - (\mathbb{E}[X])^2

对于样本数据，对应的简化公式为：

s^2 = \frac{1}{n-1} \left( \sum_{i=1}^{n} x_i^2 - n\bar{x}^2 \right)

或等价地：

s^2 = \frac{1}{n-1} \left[ \sum_{i=1}^{n} x_i^2 - \frac{1}{n} \left( \sum_{i=1}^{n} x_i \right)^2 \right]

这些公式避免了重复计算每个数据点与均值的偏差，大大提高了计算效率。

四、方差的主要性质

方差具有一系列重要的数学性质，这些性质在理论推导和实际计算中至关重要：

非负性：对于任意随机变量 $X$ ，有 $\operatorname{Var}(X) \geq 0$ ，且 $\operatorname{Var}(X) = 0$ 当且仅当 $X$ 几乎必然等于某个常数。
常数的方差为零：若 $c$ 为常数，则 $\operatorname{Var}(c) = 0$ 。常数没有波动性。
线性变换性质：对于任意常数 $a$ 和 $b$ ，有： \[ \operatorname{Var}(aX + b) = a^2 \operatorname{Var}(X) \] 这表明对随机变量进行平移不影响其方差，而缩放则以平方倍数影响方差。
独立随机变量之和的方差：若 $X$ 与 $Y$ 相互独立，则： \[ \operatorname{Var}(X + Y) = \operatorname{Var}(X) + \operatorname{Var}(Y) \] 这一性质可推广至 $n$ 个相互独立的随机变量。
一般情况下的方差加法公式：对任意两个随机变量： \[ \operatorname{Var}(X + Y) = \operatorname{Var}(X) + \operatorname{Var}(Y) + 2\operatorname{Cov}(X, Y) \] 其中 $\operatorname{Cov}(X, Y)$ 为协方差，反映两个变量的线性相关性。

五、方差与标准差

标准差 (Standard Deviation) 是方差的平方根，总体标准差记作 $\sigma$ ，样本标准差记作 $s$ ：

$\sigma$ = $\sqrt{\sigma^2}$ , \quad s = $\sqrt{s^2}$

虽然方差在数学运算中具有优良的性质（如方差分解、最小二乘法等），但其量纲是原始数据的平方，在实际解释中不够直观。标准差恢复了与原始数据相同的量纲，因此在描述性统计中更为常用。两者共同构成现代风险度量的基石。

六、方差的统计意义

6.1 作为二阶中心矩

方差是随机变量的二阶中心矩，反映了概率分布的离散特征。在矩的体系中，一阶矩是均值（位置参数），二阶矩是方差（尺度参数），三阶和四阶中心矩分别对应偏度和峰度，描述分布的形状特征。

6.2 方差与数据分布

方差与切比雪夫不等式密切相关：对于任意分布，至少有 $1 - 1/k^2$ 的数据落在均值 $\pm k$ 个标准差的范围内。这一结论不依赖于具体分布形态，体现了方差作为离散程度度量的普适性。

在正态分布中，方差具有更精确的解释：约 68.27\% 的数据落在 $\mu \pm \sigma$ 内，约 95.45\% 落在 $\mu \pm 2\sigma$ 内，约 99.73\% 落在 $\mu \pm 3\sigma$ 内。这一经验法则构成了质量控制和异常值检测的理论基础。

6.3 方差在统计推断中的作用

方差在统计推断中占据核心地位：

假设检验：在 $t$ 检验、 $F$ 检验和方差分析中，样本方差是构建检验统计量的关键组成部分。
回归分析：在线性回归中，残差的方差用于评估模型的拟合优度，并计算回归系数的标准误。
置信区间：均值等参数的置信区间构建依赖于方差的估计。
大数定律与中心极限定理：这两个极限定理描述了样本均值在方差有限条件下的渐近行为，是整个推断统计学的理论基础。

七、方差的经济金融应用

7.1 风险管理与投资组合理论

在金融经济学中，方差（及标准差）是度量风险的首要指标。现代投资组合理论（Modern Portfolio Theory）由哈里·马科维茨提出，其核心思想是：在期望收益相同的情况下，投资者偏好方差更小的投资组合。资产的期望收益衡量回报，而收益的方差衡量风险。

投资组合的方差不仅取决于各资产的个体方差，还取决于资产间的协方差。对于包含 $n$ 种资产的组合，其方差为：

\sigma_p^2 = \sum_{i=1}^{n} w_i^2 \sigma_i^2 + \sum_{i \neq j} w_i w_j \sigma_{ij}

其中 $w_i$ 为资产 $i$ 的权重， $\sigma_i^2$ 为其方差， $\sigma_{ij}$ 为资产 $i$ 与 $j$ 的协方差。

7.2 期权定价

在期权定价模型中，标的资产收益率的方差（或波动率）是决定期权价值的关键参数。布莱克-舒尔斯模型中，波动率 $\sigma$ 直接出现在定价公式中，反映了标的资产价格的不确定性。

7.3 宏观经济波动

在宏观经济学中，主要经济变量（如 GDP 增长率、通货膨胀率、失业率）的方差用于度量经济周期的波动幅度。政策制定者通常致力于降低这些变量的方差，以实现经济稳定。

7.4 质量管理与六西格玛

在质量管理领域，方差用于度量生产过程的稳定性。六西格玛（Six Sigma）方法论的目标是将过程方差控制在极低水平，使得缺陷率不超过百万分之 3.4。

八、方差的推广与扩展

8.1 协方差矩阵

对于多维随机向量 $\mathbf{X} = (X_1, X_2, \ldots, X_p)^T$ ，其协方差矩阵是一个 $p \times p$ 的对称矩阵，对角线元素是各分量的方差，非对角线元素是分量间的协方差：

公式暂不可显示

$\operatorname{Var}$ ( $X_1$ ) \& $\operatorname{Cov}$ ( $X_1$ , $X_2$ ) \& \cdots \& $\operatorname{Cov}$ ( $X_1$ , $X_p$ ) \\ $\operatorname{Cov}$ ( $X_2$ , $X_1$ ) \& $\operatorname{Var}$ ( $X_2$ ) \& \cdots \& $\operatorname{Cov}$ ( $X_2$ , $X_p$ ) \\ \vdots \& \vdots \& \ddots \& \vdots \\ $\operatorname{Cov}$ ( $X_p$ , $X_1$ ) \& $\operatorname{Cov}$ ( $X_p$ , $X_2$ ) \& \cdots \& $\operatorname{Var}$ ( $X_p$ )

公式暂不可显示

协方差矩阵是多元统计分析的基础工具，广泛应用于主成分分析、因子分析和判别分析等方法中。

8.2 条件方差

在时间序列分析和计量经济学中，条件方差是一个重要概念。它表示在给定某些信息集下，随机变量的方差。例如，在ARCH模型和GARCH模型中，条件方差被用于建模金融时间序列的异方差性（波动性聚集现象）。

8.3 方差分解

在方差分析中，总方差被分解为不同来源的方差分量，以检验各因素对因变量的影响是否显著。这种分解思想是实验设计的理论基础。

九、方差的局限性

尽管方差应用广泛，但也存在局限性：

对异常值敏感：由于使用平方运算，方差对极端值极为敏感，可能被少数异常值主导。
仅反映离散程度：方差不提供关于分布形状的信息，两个分布可能有相同方差但形态迥异。
量纲问题：方差的单位为原始单位的平方，解释性不如标准差。

因此，在实际分析中，方差常与其他统计量（如均值、中位数、偏度、峰度）结合使用，以全面描述数据特征。在稳健统计中，研究者也会考虑使用平均绝对偏差等对异常值不敏感的替代度量。

十、计算示例

假设某股票在过去 5 个交易日的收益率（\%）分别为：2.1, -0.5, 3.2, 1.8, -1.2。计算其样本方差。

计算过程：

计算样本均值： $\bar{x} = (2.1 - 0.5 + 3.2 + 1.8 - 1.2)/5 = 1.08$ \%
计算各偏差平方： \begin{itemize}
$(2.1 - 1.08)^2 = 1.0404$
$(-0.5 - 1.08)^2 = 2.4964$
$(3.2 - 1.08)^2 = 4.4944$
$(1.8 - 1.08)^2 = 0.5184$
$(-1.2 - 1.08)^2 = 5.1984$ \end{itemize}
求和： $\sum (x_i - \bar{x})^2 = 13.748$
计算样本方差： $s^2 = 13.748/(5-1) = 3.437$ （\%²）

因此，该股票收益率的样本方差为 3.437 个百分点平方，标准差为 $\sqrt{3.437} \approx 1.854$ \%。

总结

方差作为度量离散程度的核心工具，在数学理论、统计推断和实际应用中均占据不可替代的地位。理解方差的定义、性质和计算方法，掌握总体方差与样本方差的区别，以及认识其在各领域中的应用，是深入学习统计学、计量经济学和金融工程的必要基础。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。