ARTICLE
联合检验
联合检验 (Joint Test) 联合检验(Joint Test),又称联合假设检验(Joint Hypothesis Test),是统计推断中同时对多个参数施加约束的检验方法。与之相对的是逐项t检验(对单个参数分别检验)。联合检验的核心价值在于:当研究者关心一组系数是否"整体显著"时,单独检验每个系数会导致第一类错误膨胀,而联合检验通过单一统计量一次性评
联合检验 (Joint Test)
联合检验(Joint Test),又称联合假设检验(Joint Hypothesis Test),是统计推断中同时对多个参数施加约束的检验方法。与之相对的是逐项t检验(对单个参数分别检验)。联合检验的核心价值在于:当研究者关心一组系数是否"整体显著"时,单独检验每个系数会导致第一类错误膨胀,而联合检验通过单一统计量一次性评估所有约束,将总显著性水平控制于预设值 。联合检验也是理解模型设定检验、工具变量有效性检验以及因果关系推断的基础框架。
多重比较问题
对 个独立的约束分别进行显著性水平为 的检验,原假设为真时至少拒绝一个的概率为:
当 时,该概率约为 0.226;当 时高达 0.401。这正是多重比较问题的核心——逐项检验无法控制整体犯错率。联合检验的使命即是解决这一问题:它构造一个统计量将全部约束纳入同一框架,使整体检验水平严格等于 。值得注意的是,单个 t 检验不显著而联合检验显著的情况并非矛盾——各系数本身与零无显著差异,但它们集体偏离零的方向一致时,联合检验可累积足够信号因而拒绝原假设。
线性回归中的F检验
在经典线性回归模型 (满足正态性假设 )中,检验联合假设 (其中 为 约束矩阵, 为约束个数)可采用精确的 F 检验。设无约束模型残差平方和为 ,施加约束后受约束模型残差平方和为 ,则:
统计直觉:若原假设成立,施加约束不会显著增加残差平方和,故 应较小;反之,若约束不成立,残差平方和大幅增加导致 F 值偏大,从而拒绝 。此检验为精确有限样本检验,在计量经济学中应用极广——最常见的例子是检验回归方程的整体显著性 ,此时 F 统计量退化为:
该统计量由方差分析(ANOVA)表直接给出,是绝大多数回归软件输出的标准内容。在检验教育回报率是否因性别而异时,研究者可纳入交互项 ,然后联合检验"交互项系数 = 0 且 female 主效应系数 = 0"以判断性别差异的整体显著性。
Wald检验
当正态性假设不成立或模型为非线性时,Wald检验提供了渐近框架。Wald检验的优点在于仅需估计无约束模型。对于 ,Wald统计量为:
该统计量衡量 偏离原假设值 的马氏距离平方。若使用稳健标准误(如Eicker-Huber-White标准误)替代普通标准误,即得异方差稳健版本的Wald检验,这一做法在微观计量经济学中极为常见。Wald检验的劣势在于对非线性约束存在参数化不变性缺失——同一约束的不同数学表述可得出不同的Wald统计量值,此时似然比检验更为可靠。
似然比检验
似然比检验(Likelihood Ratio Test, LRT)比较受约束与无约束模型的对数似然函数最大值之差:
其中 和 分别为无约束和受约束模型的对数似然最大值。LRT 需要同时估计两个模型,但其优势在于对参数化方式不敏感——相同约束的任何等价表述给出完全相同的 LR 统计量。在大样本下,Wald、LM 和 LR 三种检验渐近等价。三者关系中一个有用的不等式链为 ,这在广义线性模型(GLM)框架下尤为突出。
LM检验(得分检验)
LM检验(Lagrange Multiplier Test),又称得分检验(Score Test),仅需估计受约束模型。它检验在受约束估计值处,得分向量(对数似然的一阶导数)是否显著偏离零:
其中 为得分函数, 为Fisher信息矩阵。LM检验在异方差检验(如Breusch-Pagan检验)、自相关检验(如Durbin-Watson检验)以及模型设定检验中尤为常用,因为这些场景下只需估计原假设下的简约模型即可构造检验统计量。
应用场景
联合检验在实证经济学中无处不在,是连接理论模型与数据检验的核心纽带。Chow检验用于判断两组数据的回归系数是否完全相同,其本质是联合假设"所有系数跨组无差异";Ramsey RESET检验通过联合检验拟合值平方项、立方项的系数是否为零来诊断模型设定偏误;Granger因果检验在向量自回归(VAR)框架下联合检验所有滞后项的系数为零以判断预测能力;因子模型中检验"所有定价误差同时为零"的联合假设以评估资产定价模型的有效性;Fama-French三因子模型中联合检验截距项是否为零以判断是否遗漏系统性风险因子。此外,联立方程模型中的过度识别检验(Sargan检验或Hansen J检验)本质上也是联合零假设"所有工具变量均有效"的检验。
报告联合检验结果时,通常需列明约束个数 、检验统计量的具体数值及其自由度、对应的 p 值,以及受约束与无约束模型的拟合优度对比。若联合检验显著,应进一步通过子集检验或置信区间定位具体哪些约束被违反,而非笼统地断言"所有参数均不为零"。联合检验是实证研究从单变量描述走向多元因果推断的重要桥梁,在面板数据、时间序列和非参数计量经济学中均有广泛延伸,是计量经济学方法论中不可或缺的基本工具。