ARTICLE

贝叶斯计量经济学

贝叶斯计量经济学 (Bayesian Econometrics) 贝叶斯计量经济学 (Bayesian Econometrics) 是将 贝叶斯统计 的推断范式系统应用于 计量经济学 建模、估计与预测的分支学科。与以 最大似然估计 和 广义矩方法 为代表的经典频率学派方法不同,贝叶斯计量经济学将模型中的所有未知量——包括参数 、潜变量和模型本身——都视为随机

浏览 4 更新 2025-10-29

贝叶斯计量经济学 (Bayesian Econometrics)

贝叶斯计量经济学 (Bayesian Econometrics) 是将 贝叶斯统计 的推断范式系统应用于 计量经济学 建模、估计与预测的分支学科。与以 最大似然估计广义矩方法 为代表的经典频率学派方法不同,贝叶斯计量经济学将模型中的所有未知量——包括参数 θ\theta、潜变量和模型本身——都视为随机变量,并通过 先验分布 与样本信息的综合,推导出完整的 后验分布 p(θ数据)p(\theta \mid \text{数据}),从而实现对参数不确定性的直接概率陈述。

贝叶斯推断的基本框架

贝叶斯计量经济学的核心是 贝叶斯定理。对于待估参数向量 θ\theta 和观测数据 y=(y1,,yT)y = (y_1, \ldots, y_T),后验分布由先验分布与似然函数的乘积经归一化后给出:

p(θy)=p(yθ)p(θ)p(y)p(yθ)p(θ)p(\theta \mid y) = \frac{p(y \mid \theta) \, p(\theta)}{p(y)} \propto p(y \mid \theta) \, p(\theta)

其中,p(yθ)p(y \mid \theta)似然函数,表述了给定参数下数据的生成概率;p(θ)p(\theta)先验分布,编码了研究者在观测数据之前对参数值的已有知识或信念;p(y)p(y)边缘似然,在参数推断中作为归一化常数。

贝叶斯推断的三大优势在于:其一,后验分布提供了参数的完整概率描述,包括任意分位数和最高后验密度区间,无需依赖渐近正态近似;其二,先验分布允许将经济学理论的先验约束自然地融入估计过程;其三,模型比较可通过边缘似然的比值(贝叶斯因子)直接进行,避免了经典假设检验中的嵌套模型限制。

先验分布的选择

无信息先验 旨在让数据主导推断。Jeffreys 先验定义为 p(θ)I(θ)p(\theta) \propto \sqrt{|I(\theta)|},其中 I(θ)I(\theta)Fisher信息 矩阵,具有参数变换不变性。

共轭先验 使先验与后验属于同一分布族,简化计算。在正态线性回归模型 yN(Xβ,σ2I)y \sim N(X\beta, \sigma^2 I) 中,对 β\beta 使用正态先验、对 σ2\sigma^2 使用逆伽马先验即构成共轭族。

层级先验 将先验参数的分布进一步参数化,在处理面板数据的随机效应模型和离散选择模型的混合分布时尤为有用。

后验模拟:马尔可夫链蒙特卡洛方法

除共轭情形外,后验分布没有解析闭式。马尔可夫链蒙特卡洛方法通过构造以目标后验为平稳分布的马尔可夫链,迭代采样获得后验样本 {θ(s)}s=1S\{\theta^{(s)}\}_{s=1}^{S},然后基于样本计算后验均值、后验标准差和可信区间等汇总统计量。

Gibbs 抽样 将参数向量拆分为若干块,依次从各块的全条件后验分布 p(θkθk,y)p(\theta_k \mid \theta_{-k}, y) 中采样。在正态线性回归模型中,β\betaσ2\sigma^2 的全条件后验具有标准分布形式。

Metropolis-Hastings 算法 适用于全条件后验非标准的情形。从提议分布 q(θθ(s1))q(\theta^* \mid \theta^{(s-1)}) 中抽取候选值 θ\theta^*,以概率

α=min{1,p(θy)q(θ(s1)θ)p(θ(s1)y)q(θθ(s1))}\alpha = \min\left\{1, \frac{p(\theta^* \mid y) \, q(\theta^{(s-1)} \mid \theta^*)}{p(\theta^{(s-1)} \mid y) \, q(\theta^* \mid \theta^{(s-1)})}\right\}

接受候选值。MH算法是现代贝叶斯软件中HMC/NUTS采样器的理论基础。

贝叶斯线性回归模型

考虑标准线性回归模型 y=Xβ+εy = X\beta + \varepsilonεN(0,σ2IT)\varepsilon \sim N(0, \sigma^2 I_T)。采用正态-逆伽马共轭先验:βσ2N(β0,σ2V0)\beta \mid \sigma^2 \sim N(\beta_0, \sigma^2 V_0)σ2IG(a0,b0)\sigma^2 \sim IG(a_0, b_0)。则 β\beta 的后验均值为:

E(βy)=(XX+V01)1(Xy+V01β0)E(\beta \mid y) = (X'X + V_0^{-1})^{-1} (X'y + V_0^{-1}\beta_0)

当先验方差 V0V_0 很大时,后验均值趋近于OLS估计量;当样本量很大时,先验的影响渐趋于零。

模型比较与贝叶斯因子

贝叶斯因子定义为两个模型边缘似然的比值:BF12=p(yM1)/p(yM2)BF_{12} = p(y \mid M_1) / p(y \mid M_2),直接衡量数据对 M1M_1 相对于 M2M_2 的支持程度,自动包含对模型复杂度的惩罚。

应用领域

贝叶斯方法在 VAR模型 中通过 Minnesota 先验克服过参数化问题;在 DSGE模型 估计中是各国央行的标准工具;在 离散选择模型 中自然地处理潜变量和随机系数的高维积分。贝叶斯模型平均 通过在所有候选模型上加权平均来量化模型不确定性。前沿方向包括 变分贝叶斯 用于大规模数据的快速近似推断,以及 贝叶斯非参数方法 用于灵活的函数和分布建模。