ARTICLE

调和平均数

调和平均数 (Harmonic Mean) 调和平均数 (Harmonic Mean) 是统计学中三种主要的毕达哥拉斯平均数 (Pythagorean Means) 之一,与算术平均数 (Arithmetic Mean) 和几何平均数 (Geometric Mean) 并列。调和平均数的独特之处在于,它通过倒数关系来平均一组数值,使得它在处理速率、比率和密度

浏览 9 更新 2025-10-27

调和平均数 (Harmonic Mean)

调和平均数 (Harmonic Mean) 是统计学中三种主要的毕达哥拉斯平均数 (Pythagorean Means) 之一,与算术平均数 (Arithmetic Mean) 和几何平均数 (Geometric Mean) 并列。调和平均数的独特之处在于,它通过倒数关系来平均一组数值,使得它在处理速率比率密度等具有倒数关系的变量时,成为最合适且最自然的集中趋势度量。它被定义为数据集中各数值倒数的算术平均数的倒数。

定义与计算公式

对于一组包含 n n 个正数的数据集 x1,x2,,xn x_1, x_2, \ldots, x_n ,其调和平均数 H H 的计算公式为:

H=ni=1n1xi=n1x1+1x2++1xnH = \frac{n}{\sum_{i=1}^{n} \frac{1}{x_i}} = \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + \cdots + \frac{1}{x_n}}

从公式中可以清晰地看出调和平均数的本质特征:它赋予较小的数值以更大的权重。由于计算中涉及倒数运算,一个非常小的 xi x_i 会产生非常大的倒数,从而不成比例地压低总的调和平均数。因此,调和平均数总是小于或等于几何平均数,而几何平均数又小于或等于算术平均数(对于同一组正数数据)——这一关系被称为算术-几何-调和平均数不等式 (AM-GM-HM Inequality)。

加权调和平均数。当数据中的各个数值具有不同的权重时,可以使用加权调和平均数。其计算公式为:

Hw=i=1nwii=1nwixiH_w = \frac{\sum_{i=1}^{n} w_i}{\sum_{i=1}^{n} \frac{w_i}{x_i}}

其中 wi w_i 是第 i i 个观测值的权重。加权调和平均数在处理不同组别具有不同样本量的情况时尤为重要。

主要应用场景

调和平均数之所以重要,是因为它在现实世界中解决了一类特殊的平均问题——当待平均的量在概念上天然与某个分母存在倒数关系时。

平均速度

调和平均数最经典的例子莫过于计算平均速度。假设一个人驾车从城市 A 前往城市 B,去程速度为 v1=60 v_1 = 60 公里/小时,返程(沿相同路线)速度为 v2=40 v_2 = 40 公里/小时。请问整个往返行程的平均速度是多少?

常见的误解:很多人会错误地使用算术平均数,得到 (60+40)/2=50 (60 + 40)/2 = 50 公里/小时。但这个答案在物理上是不正确的,因为去程和返程虽然距离相等,但所花费的时间不同——速度较慢的行程占据了更多的时间。

正确的计算:设单程距离为 d d 。去程用时 t1=d/60 t_1 = d/60 ,返程用时 t2=d/40 t_2 = d/40 。总路程为 2d 2d ,总时间为 d/60+d/40 d/60 + d/40 。平均速度为:

vˉ=2dd/60+d/40=21/60+1/40=21/24=48 公里/小时\bar{v} = \frac{2d}{d/60 + d/40} = \frac{2}{1/60 + 1/40} = \frac{2}{1/24} = 48 \text{ 公里/小时}

这正是调和平均数的计算结果 H=21/60+1/40=48 H = \frac{2}{1/60 + 1/40} = 48 。因此,当各段行程的距离相等时,平均速度必须使用调和平均数。

金融领域的应用

金融学中,调和平均数也有重要应用。例如,在计算市盈率 (P/E Ratio) 的投资组合平均值时,调和平均数比算术平均数更为合适。假设投资者等额购买了三种股票,其市盈率分别为 10、15 和 30。由于等额投资意味着在各股票上投入相同金额——这对应于在各股票上拥有相同的"分母金额"(即购买价格),因此使用调和平均数:

H=31/10+1/15+1/30=30.1+0.0667+0.0333=30.2=15H = \frac{3}{1/10 + 1/15 + 1/30} = \frac{3}{0.1 + 0.0667 + 0.0333} = \frac{3}{0.2} = 15

这个结果 15 正确地反映了投资组合的整体市盈率水平。而算术平均数 18.33 18.33 则高估了整体的估值水平。类似的原理也适用于平均成本(如定投策略中的平均成本计算):当每期投入相同金额购买股票时,购入股票的平均成本正是各期价格的调和平均数。

平行电路中的电阻

物理学中,调和平均数自然地出现在并联电路电阻的计算中。当多个电阻 R1,R2,,Rn R_1, R_2, \ldots, R_n 并联时,总电阻 Rtotal R_{\text{total}} 满足:

1Rtotal=1R1+1R2++1Rn\frac{1}{R_{\text{total}}} = \frac{1}{R_1} + \frac{1}{R_2} + \cdots + \frac{1}{R_n}

因此,总电阻 Rtotal R_{\text{total}} 正是各电阻值的调和平均数的 1/n 1/n ,或者说,并联电路中 n n 个等值电阻的等效电阻等于单个电阻值的调和平均数。这一物理事实深刻反映了调和平均数在倒数关系中的自然地位。

主要性质

算术-几何-调和平均数不等式。对于任何一组正实数,以下不等式恒成立:

AMGMHM\text{AM} \geq \text{GM} \geq \text{HM}

等号成立的唯一条件是所有数值相等。这一不等式链揭示了三种毕达哥拉斯平均数之间的内在层次关系。特别地,当数据的变异性增大时,调和平均数与算术平均数的差距也会随之扩大。

对异常值的敏感性。调和平均数的敏感性模式与算术平均数截然不同。算术平均数被极大的异常值 (Outliers) 严重拉高,而调和平均数则对极小的数值异常敏感。只要数据中出现一个非常接近零的值,调和平均数就会被急剧压低至接近零的水平。因此,在使用调和平均数时需要确保数据中没有测量误差导致的极端小值。

倒数的对称性。调和平均数的一个关键数学性质是:一组数值的调和平均数的倒数,等于这些数值倒数的算术平均数,即 1/H=(1/n)1/xi 1/H = (1/n)\sum 1/x_i 。这一性质使得调和平均数与算术平均数之间通过倒数变换建立了直接的双向联系。

标度不变性。如果将数据集中的每个数值乘以一个正常数 c c ,那么新的调和平均数也乘以同样的常数 c c

H(cx1,cx2,,cxn)=cH(x1,x2,,xn)H(cx_1, cx_2, \ldots, cx_n) = c \cdot H(x_1, x_2, \ldots, x_n)

使用注意事项与局限性

调和平均数虽然在某些场景下不可或缺,但使用时仍需注意以下限制:

  1. 数据必须为正数。调和平均数要求所有数据点均为正数。如果数据中包含零,分母中将出现无穷大,导致调和平均数无定义。如果数据中包含负数,则计算结果可能失去意义或无法解释。
  2. 适用于倒数有意义的情形。调和平均数仅在变量本身的倒数具有现实含义时才适用。例如,速度的倒数(即单位距离所需时间)具有明确含义,因此调和平均数适用于平均速度的计算。
  3. 与算术平均数配合使用。在实际数据分析中,不应孤立地使用调和平均数。通常建议同时报告算术平均数和调和平均数,两者的差距可以直观地反映数据的偏斜程度和变异大小。

与其他平均数的关系

三种毕达哥拉斯平均数服务于不同类型的数据分析需求。算术平均数回答的是"如果所有值相等,它们的总和不变会是多少";几何平均数回答的是"如果所有值相等,它们的乘积不变会是多少";而调和平均数回答的是"如果所有值相等,它们的倒数和不变会是多少"。选择哪一种平均数,取决于数据所内蕴的加法结构、乘法结构还是倒数结构。