ARTICLE

均值

均值 (Mean) 均值 (Mean)，在日常语境中常被称为平均数 (Average)，是统计学和数学中最基本、最重要的概念之一。它用于衡量一组数据的集中趋势 (Central Tendency)，即描述数据中心位置的单一代表性数值。均值试图概括整个数据集的"典型"或"中心"水平。主要类型及其计算虽然"均值"通常默认指代算术平均数，但在不同应用场景下，存

浏览 57 更新 2025-10-26

均值 (Mean)

均值 (Mean)，在日常语境中常被称为平均数 (Average)，是统计学和数学中最基本、最重要的概念之一。它用于衡量一组数据的集中趋势 (Central Tendency)，即描述数据中心位置的单一代表性数值。均值试图概括整个数据集的"典型"或"中心"水平。

主要类型及其计算

虽然"均值"通常默认指代算术平均数，但在不同应用场景下，存在多种计算均值的方式。选择何种均值取决于数据的性质和分析的目标。

算术平均数 (Arithmetic Mean)

这是最常见、最广为人知的均值类型。它的计算方法是将数据集中所有数值相加，然后除以数值的个数。

在统计学中，我们区分总体和样本：

总体均值 (Population Mean)：代表整个研究对象群体（即总体）的均值，通常用希腊字母 $\mu$ (mu) 表示。 \[ \mu = \frac{\sum_{i=1}^{N} x_i}{N} = \frac{x_1 + x_2 + \cdots + x_N}{N} \] 其中， $N$ 是总体中的个体总数， $x_i$ 是总体中的第 $i$ 个观测值。
样本均值 (Sample Mean)：从总体中抽取的一个子集（即样本）的均值，通常用 $\bar{x}$ ("x-bar") 表示。它是总体均值 $\mu$ 的一个估计量。 \[ \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} = \frac{x_1 + x_2 + \cdots + x_n}{n} \] 其中， $n$ 是样本中的观测值数量。

应用场景：适用于大多数常规情况，如计算班级平均成绩、地区平均收入、产品的平均重量等。

局限性：算术平均数对极端值 (Outliers) 非常敏感。一个或几个异常大或异常小的值会显著拉高或拉低均值，使其偏离大部分数据的中心，从而可能产生误导。

加权平均数 (Weighted Mean)

加权平均数为数据集中的每个数值分配一个"权重"( $w_i$ )，以反映其相对重要性。计算时，将每个数值与其对应的权重相乘，然后将这些乘积相加，最后除以所有权重之和。

计算公式：

\bar{x}_w = \frac{\sum_{i=1}^{n} w_i x_i}{\sum_{i=1}^{n} w_i}

其中， $x_i$ 是第 $i$ 个观测值， $w_i$ 是其对应的权重。

应用场景：

计算学分绩点 (GPA)：不同课程的学分不同，学分就是权重。
投资组合回报率：投资组合中不同资产的资金占比不同，占比就是权重。
消费者价格指数 (CPI)：计算一篮子商品和服务的平均价格变动时，不同项目在居民消费支出中的重要性不同，其支出份额即为权重。

几何平均数 (Geometric Mean)

几何平均数通过将所有数值相乘然后开 $n$ 次方得到。它特别适用于处理比率、百分比变化率或具有内在乘法关系的数据。

计算公式：

GM = \left(\prod_{i=1}^{n} x_i\right)^{1/n} = \sqrt[n]{x_1 \cdot x_2 \cdot \cdots \cdot x_n}

在实际计算中，为避免大数乘积导致的计算困难，通常使用对数进行计算：

\ln(GM) = \frac{1}{n} \sum_{i=1}^{n} \ln(x_i) \implies GM = \exp\left(\frac{\sum_{i=1}^{n} \ln(x_i)}{n}\right)

应用场景：

计算平均增长率或回报率：例如，一项投资第一年增长20\%（增长因子为1.20），第二年亏损10\%（增长因子为0.90）。其两年的平均年增长因子不是算术平均数 $(1.20+0.90)/2 = 1.05$ ，而是几何平均数 $\sqrt{1.20 \times 0.90} = \sqrt{1.08} \approx 1.039$ 。这对应于约3.9\%的年均增长率，准确反映了最终的资本水平。该方法是计算复合年均增长率 (CAGR) 的基础。

调和平均数 (Harmonic Mean)

调和平均数是所有数值的倒数的算术平均数的倒数。它适用于计算平均速率、平均效率等场景。

计算公式：

HM = \frac{n}{\sum_{i=1}^{n} \frac{1}{x_i}}

应用场景：

计算平均速度：假设一个人以 60 km/h 的速度从A地到B地，然后以 40 km/h 的速度返回A地。计算整个往返过程的平均速度时，不能使用算术平均数 $(60+40)/2 = 50$ km/h。正确的平均速度应为调和平均数： \[ \text{平均速度} = \frac{2}{\frac{1}{60} + \frac{1}{40}} = \frac{2}{\frac{2+3}{120}} = \frac{2 \times 120}{5} = 48 \text{ km/h} \] 这是因为在相同距离下，速度越慢，花费的时间越长，因此低速区段对平均速度的权重影响更大。

均值的重要性质

与期望值的关系：在概率论中，一个随机变量的期望值 (Expected Value)，记为 $E[X]$ ，在概念上等同于该变量的总体均值 $\mu$ 。样本均值 $\bar{x}$ 是期望值的一个无偏估计。
对极端值的敏感性：如前所述，算术平均数受极端值影响很大。在存在极端值的数据集（例如个人收入数据），中位数 (Median) 通常是比均值更好的集中趋势度量。
与中位数和众数的比较： \begin{itemize}
在完全的对称分布 (Symmetric Distribution)，如正态分布中，均值、中位数和众数 (Mode)三者相等。
在偏态分布 (Skewed Distribution)中，它们的位置会发生偏离： \begin{itemize}
右偏态分布 (Right-Skewed Distribution)：分布有很长的右尾（少数极大值），均值会被这些极大值拉高。此时，均值 $>$ 中位数 $>$ 众数。
左偏态分布 (Left-Skewed Distribution)：分布有很长的左尾（少数极小值），均值会被这些极小值拉低。此时，均值 $<$ 中位数 $<$ 众数。 \end{itemize} \end{itemize}
代数性质： \begin{itemize}
离差和为零：数据集中每个值与算术平均数的偏差（ $x_i - \bar{x}$ ）之和恒等于零。即 $\sum_{i=1}^{n} (x_i - \bar{x}) = 0$ 。
最小化平方误差：算术平均数是唯一能够使数据集中各数值与其偏差的平方和（Sum of Squared Errors, SSE）达到最小的数值。即函数 $f(m) = \sum_{i=1}^{n} (x_i - m)^2$ 在 $m = \bar{x}$ 时取得最小值。这一性质是方差 (Variance) 定义和最小二乘法 (Method of Least Squares) 的理论基础。 \end{itemize}

统计推断中的均值

在统计推断 (Statistical Inference) 中，样本均值 $\bar{x}$ 扮演着至关重要的角色。根据中心极限定理 (Central Limit Theorem)，无论总体自身的分布形态如何，只要样本量 $n$ 足够大，所有可能的样本均值的抽样分布将近似于一个正态分布。这个分布的均值等于总体均值 $\mu$ ，其标准差（称为标准误 Standard Error）为 $\sigma/\sqrt{n}$ 。这一定理是进行假设检验 (Hypothesis Testing) 和构造置信区间 (Confidence Interval) 的理论基石。

与大数定律的关联方面，大数定律 (Law of Large Numbers) 保证了当样本量趋于无穷时，样本均值 $\bar{x}$ 以概率收敛到总体均值 $\mu$ 。换言之，样本量越大，样本均值作为总体均值估计量的精度越高。这一性质使均值成为统计推断中最基础、最可靠的点估计工具之一。

四种均值的选用原则

在实际数据分析中，选择合适的均值类型至关重要。一个简单的经验法则：若数据体现加法关系（如收入、温度），使用算术平均数；若数据体现乘法关系（如增长率、比率、指数），应优先考虑几何平均数；若数据的权重由频次或重要性决定（如综合评分、价格指数），则必须使用加权平均数；若涉及"单位距离内的平均速率"类问题（如平均速度、平均工作效率），调和平均数才能给出正确的答案。错误地选用均值类型会导致分析结论产生系统性偏差，这也是经济学和金融学中需要特别警惕的问题。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。