ARTICLE
负相关
负相关 (Negative Correlation) 负相关 (Negative Correlation),又称 反向相关 (Inverse Correlation),是统计学和计量经济学中描述两个变量之间关系方向的基本概念。它指的是当一个变量的取值倾向于增加时,另一个变量的取值倾向于减少,反之亦然。负相关刻画了两个变量之间相反方向的共变关系。 与负相关相对
负相关 (Negative Correlation)
负相关 (Negative Correlation),又称 反向相关 (Inverse Correlation),是统计学和计量经济学中描述两个变量之间关系方向的基本概念。它指的是当一个变量的取值倾向于增加时,另一个变量的取值倾向于减少,反之亦然。负相关刻画了两个变量之间相反方向的共变关系。
与负相关相对的概念是正相关 (Positive Correlation,同向变动) 和零相关 (Zero Correlation,不存在线性关联)。度量这种关系强度和方向的核心工具是相关系数 (Correlation Coefficient)。
相关系数与负相关的度量
皮尔逊相关系数
衡量两个连续变量之间线性关系最常用的指标是 皮尔逊相关系数 (Pearson Correlation Coefficient),通常记为 或 (总体相关系数)。对于负相关,其取值范围为:
- :完全负相关,所有数据点精确落在一条斜率为负的直线上。
- :不同程度的负相关, 越接近 ,负相关越强;越接近 ,负相关越弱。
- :不存在线性相关关系。
皮尔逊相关系数的计算公式为:
当 时,分子中的协方差 为负数,意味着当 高于其均值时, 倾向于低于其均值(或相反),从而产生负的交叉乘积之和。
协方差:负相关的数学基础
皮尔逊相关系数本质上是标准化后的协方差 (Covariance)。协方差的定义为:
- 当 时, 与 呈负相关—— 高于其均值时 倾向于低于其均值。
- 协方差的缺点是受变量量纲影响,难以直接比较不同变量对之间相关性的强弱,因此通常将其标准化为相关系数。
散点图上的负相关
在散点图 (Scatter Plot) 上,负相关表现为数据点沿一条从左上方向右下方倾斜的趋势线分布。拟合这些点的最优直线(即普通最小二乘法回归线)具有负斜率。
- 强负相关:数据点紧密地围绕在负斜率的直线周围。
- 弱负相关:数据点弥散分布,但仍可辨识出从左上方到右下方的总体趋势。
- 完全负相关 ():所有点精确落在一条负斜率直线上(现实中极为罕见)。
经济学中的经典负相关案例
1. 需求定律:价格与需求量
需求定律 (Law of Demand) 是经济学中最著名的负相关关系。它指出,在其他条件不变的情况下,一种商品的价格 () 与其需求量 () 之间存在反向关系:
当价格上涨时,消费者倾向于购买更少的该商品;当价格下跌时,需求量增加。在典型的向下倾斜的需求曲线上,这种负相关体现得淋漓尽致。
2. 菲利普斯曲线:失业率与通货膨胀率
短期菲利普斯曲线 (Phillips Curve) 描述了失业率与通货膨胀率(或工资增长率)之间的负相关关系。A.W. 菲利普斯在 1958 年对英国数据的经验研究中发现:当失业率较低时,工资倾向于快速上涨;当失业率较高时,工资增长趋缓甚至下降。这一负相关关系在 20 世纪 60 年代成为宏观经济政策制定的重要参考。
3. 债券价格与利率
在金融领域,债券价格与市场利率(或收益率)之间存在精确的负相关关系。当市场利率上升时,现有固定利率债券的未来现金流按更高的折现率折现,导致债券价格下跌;当利率下降时,债券价格上涨。对于零息债券,这种关系由定价公式直接给出:
其中 为债券价格, 为面值, 为市场利率, 为期限。 关于 的导数为负,精确体现了二者之间的负相关。
4. 风险资产的收益负相关与对冲
投资组合理论中,现代投资组合理论 (Modern Portfolio Theory) 强调通过持有负相关或低相关资产来实现分散化 (Diversification)。如果两种资产的收益率呈负相关,当一种资产表现不佳时,另一种资产倾向于表现良好,从而降低整体投资组合的波动性。这一原理是对冲策略的理论基础:做多一种资产的同时做空与之正相关的另一种资产(或做多与之负相关的资产),以对冲风险。
5. 奥肯定律:产出增长与失业率变化
奥肯定律 (Okun's Law) 描述了实际 GDP 增长率与失业率变化之间的负相关关系:当经济增速超过其潜在增长率时,失业率趋于下降;当经济增速低于潜在增长率时,失业率趋于上升。这是宏观经济学中连接产出市场和劳动力市场的关键经验规律。
斯皮尔曼秩相关系数
当变量之间的关系是单调但不一定是线性的,或者数据为定序变量时,可以使用 斯皮尔曼秩相关系数 (Spearman's Rank Correlation Coefficient),记为 或 。它对原始数据进行排序后计算秩次的相关性:
其中 是第 个观测在两个变量上的秩次之差。当 时,表明存在负的单调关系:一个变量增大时,另一个变量倾向于减小(但不一定以恒定速率)。
负相关的强弱分类
根据皮尔逊 的绝对值,可以大致划分相关性的强度:
| 的范围 | 强度 | |---|---:| | 到 | 弱负相关 | | 到 | 中等负相关 | | 到 | 强负相关 | | | 完全负相关 |
这一分类仅为经验法则(rule of thumb),实际解读需结合具体研究领域和样本容量。
负相关 ≠ 因果关系
极其重要的是:负相关并不意味着因果关系。两个变量之间存在负相关可能源于多种原因:
- 直接因果关系: 的增加引起 的减少(如价格上升导致需求量下降)。
- 反向因果关系: 的增加引起 的减少。
- 遗漏变量偏误:存在第三个变量 同时影响 和 ,且影响方向相反。例如,冰淇淋销量与滑雪装备销量可能呈负相关,但这并非因为两者之间有因果关系,而是受天气(第三方变量)的共同影响。
- 偶然相关:纯粹由于随机波动导致的虚假负相关,在大样本中趋于消失。
相关系数的局限性
- 仅度量线性关系:皮尔逊 只能捕捉线性相关。若两个变量存在完美的非线性关系(如 , 围绕 对称分布),其 可能接近 ,尽管两者完全由函数决定。此时应使用斯皮尔曼秩相关系数或其他非线性相关性度量。
- 对异常值敏感:少数几个异常值 (Outliers) 可能显著扭曲皮尔逊相关系数,使其虚高、虚低甚至改变符号。分析前应始终绘制散点图以识别异常值。
- 伪相关 (Spurious Correlation):两个在逻辑上毫无关联的时间序列可能仅仅因为各自具有趋势而表现出统计上的强相关(正或负)。在处理时间序列数据时,必须先进行平稳性检验或使用差分等方法去除趋势。
- 不传递性:若 与 负相关, 与 负相关,不能推断 与 的关系——它们可能是正相关、负相关或无关。
总结
负相关是统计学和经济学中最基础也最重要的关系类型之一。它由相关系数(尤其是皮尔逊 )定量度量,取值为 到 之间。从需求定律到债券定价,从菲利普斯曲线到投资组合分散化,负相关关系贯穿经济分析的各个领域。正确识别和解读负相关——尤其是将其与因果关系区分开来——是进行严谨定量分析的基本功。