ARTICLE

贝叶斯因子

贝叶斯因子 (Bayes Factor) 贝叶斯因子是贝叶斯统计中用于模型比较和假设检验的核心工具,由数据对两个竞争模型(或假设)的相对支持程度给出连续、对称的量化度量。与频率学派的p值不同,贝叶斯因子允许研究者同时评估支持零假设和支持备择假设的证据强度,而非仅仅"拒绝"或"未能拒绝"零假设。 定义与数学形式 设两个待比较的模型(或假设)为 M_1 和 M_

浏览 0 更新 2025-11-08

贝叶斯因子 (Bayes Factor)

贝叶斯因子是贝叶斯统计中用于模型比较假设检验的核心工具,由数据对两个竞争模型(或假设)的相对支持程度给出连续、对称的量化度量。与频率学派的p值不同,贝叶斯因子允许研究者同时评估支持零假设和支持备择假设的证据强度,而非仅仅"拒绝"或"未能拒绝"零假设。

定义与数学形式

设两个待比较的模型(或假设)为 M1M_1M0M_0,给定观测数据 DD,贝叶斯因子定义为两个模型下边缘似然(marginal likelihood,也称模型证据)之比:

BF10=P(DM1)P(DM0)=P(Dθ1,M1)π(θ1M1)dθ1P(Dθ0,M0)π(θ0M0)dθ0BF_{10} = \frac{P(D \mid M_1)}{P(D \mid M_0)} = \frac{\int P(D \mid \theta_1, M_1) \pi(\theta_1 \mid M_1) \, d\theta_1}{\int P(D \mid \theta_0, M_0) \pi(\theta_0 \mid M_0) \, d\theta_0}

其中 π(θM)\pi(\theta \mid M) 是参数 θ\theta 在模型 MM 下的先验分布。边缘似然通过对参数空间积分获得,本质上是模型对数据预测能力的加权平均。贝叶斯因子在形式上完全对称:BF01=1/BF10BF_{01} = 1 / BF_{10},避免了频率学派中零假设与备择假设的不对称处理。

贝叶斯因子与后验概率的关系由下式给出:

P(M1D)P(M0D)=BF10×P(M1)P(M0)\frac{P(M_1 \mid D)}{P(M_0 \mid D)} = BF_{10} \times \frac{P(M_1)}{P(M_0)}

即后验几率比等于贝叶斯因子乘以先验几率比。当先验几率为1(两个模型先验等可能)时,贝叶斯因子即为后验几率比,直接解释为"数据认为 M1M_1M0M_0 更可能的倍数"。

解释尺度

Jeffreys(1961)和 Kass 与 Raftery(1995)提出了经典的贝叶斯因子解释尺度:BF10BF_{10} 在1至3之间为"微弱证据"(barely worth mentioning),3至10为"实质性证据"(substantial),10至30为"强证据"(strong),30至100为"非常强证据"(very strong),超过100为"决定性证据"(decisive)。例如,BF10=10BF_{10} = 10 意味着在给定数据下 M1M_1 的可能性是 M0M_0 的10倍。

贝叶斯因子与BIC(贝叶斯信息准则)存在渐近联系:当样本量 nn \to \infty 时,2lnBF102(10)(k1k0)lnn=ΔBIC2 \ln BF_{10} \approx 2(\ell_1 - \ell_0) - (k_1 - k_0) \ln n = \Delta \text{BIC}。这一近似使贝叶斯因子与频率学派的模型选择准则建立了桥梁,但贝叶斯因子在有限样本下更为精确,且不依赖渐近正态性假设。

相对于p值的优势

贝叶斯因子解决了p值的若干根本性局限。第一,p值只能提供反对零假设的证据,而无法支持零假设——"未能拒绝 H0H_0"不等于"H0H_0 为真"。贝叶斯因子在 BF10<1BF_{10} < 1 时直接量化数据支持零假设的强度。第二,p值受可选停止(optional stopping)影响,序贯检验中反复检验会严重膨胀第一类错误;贝叶斯因子不受数据收集停止规则的影响,因为后验分布仅依赖于实际观察到的数据。第三,p值在大样本下几乎总是显著的(因为真实效应几乎不可能精确为零),而贝叶斯因子在零假设为真时随样本量增大趋于零,防止了"大样本必然拒绝"的困境。

在经济学中的应用与局限

计量经济学中,贝叶斯因子广泛应用于贝叶斯VAR模型的滞后阶数选择、DSGE模型的竞争性比较、以及协整关系中秩的确定。在实证微观经济学中,贝叶斯因子为A/B测试、处理效应异质性分析等场景提供了替代p值的连续证据度量。

贝叶斯因子的主要局限在于对先验分布的敏感性:当先验选择不同时贝叶斯因子可能出现实质性变化。Jeffreys-Lindley悖论指出,在点零假设检验中,若先验过于分散则即使p值极小贝叶斯因子也可能支持零假设。此外,在高维参数空间中对边缘似然的数值积分在计算上具有挑战性,通常需要借助桥采样(bridge sampling)或热力学积分等专门方法。