ARTICLE

贝叶斯学习

贝叶斯学习 (Bayesian Learning) 贝叶斯学习(Bayesian Learning)是指经济主体或统计推断者利用观测数据,依据 贝叶斯法则(Bayes' Rule)系统性地更新其关于未知参数或世界状态的不确定性信念的过程。该概念贯穿 贝叶斯统计、信息经济学、博弈论与机器学习,是在不完全信息条件下刻画理性个体如何从经验中获取知识的基础框架。 基

浏览 0 更新 2025-12-03

贝叶斯学习 (Bayesian Learning)

贝叶斯学习(Bayesian Learning)是指经济主体或统计推断者利用观测数据,依据 贝叶斯法则(Bayes' Rule)系统性地更新其关于未知参数或世界状态的不确定性信念的过程。该概念贯穿 贝叶斯统计信息经济学博弈论机器学习,是在不完全信息条件下刻画理性个体如何从经验中获取知识的基础框架。

基本框架与更新公式

贝叶斯学习由三个要素构成:先验分布(prior distribution)、似然函数(likelihood function)和后验分布(posterior distribution)。设主体对未知参数 θΘ\theta \in \Theta 持有先验信念 p(θ)p(\theta),观测数据 X=xX = x 后,根据似然 f(xθ)f(x \mid \theta) 更新为后验:

p(θx)=f(xθ)p(θ)Θf(xθ)p(θ)dθ.p(\theta \mid x) = \frac{f(x \mid \theta) \, p(\theta)}{\int_{\Theta} f(x \mid \theta') \, p(\theta') \, d\theta'}.

后验正比于先验与似然的乘积。数据信息量大时后验由似然驱动;数据噪声大或样本有限时先验作用显著。这一"先验灵活性"使贝叶斯学习在小样本场景中具有独特优势。

序列学习与鞅性质

贝叶斯学习本质上是序列更新(sequential updating)过程。数据流式到达时,主体逐期更新信念:

p(θx1,,xt)f(xtθ)p(θx1,,xt1),p(\theta \mid x_1, \ldots, x_t) \propto f(x_t \mid \theta) \cdot p(\theta \mid x_1, \ldots, x_{t-1}),

t1t-1 期的后验自然成为第 tt 期的先验。序列更新与一次性全样本更新结果一致,体现了贝叶斯框架的内在一致性。

在真实数据生成过程下,贝叶斯学习具有鞅性质(martingale property):E[p(θFt+1)Ft]=p(θFt)\mathbb{E}[p(\theta \mid \mathcal{F}_{t+1}) \mid \mathcal{F}_t] = p(\theta \mid \mathcal{F}_t)。信念的预期变化为零,这一性质在有效市场假说中具有深刻含义——在贝叶斯理性市场中,资产价格变化不可预测。

渐近收敛性与模型选择

贝叶斯学习具有后验一致性(posterior consistency):在适当正则条件下,随样本量 nn \to \infty,后验集中于真实参数值 θ0\theta_0 附近,且渐近服从正态分布:

p(θX1,,Xn)N(θ0,I(θ0)1n),p(\theta \mid X_1, \ldots, X_n) \approx \mathcal{N}\left(\theta_0, \frac{I(\theta_0)^{-1}}{n}\right),

其中 I(θ0)I(\theta_0)Fisher 信息矩阵。即使初始先验存在偏差,大量数据也能渐进修正。

在模型不确定性下,贝叶斯学习提供贝叶斯因子(Bayes Factor)进行模型选择:

BF12=p(XM1)p(XM2).BF_{12} = \frac{p(X \mid \mathcal{M}_1)}{p(X \mid \mathcal{M}_2)}.

贝叶斯因子自动惩罚模型复杂度(Ockham's razor),避免过拟合。

经济学中的应用

宏观经济学中,主体通过贝叶斯学习不断修正对经济参数的信念,理性预期均衡可视为贝叶斯学习的稳态极限。在产业组织中,企业学习竞争对手的成本或需求参数以优化决策。在金融经济学中,投资者更新对资产收益率的信念,驱动价格动态。此外,贝叶斯非参数方法——如狄利克雷过程混合模型——允许主体在模型空间上学习,进一步拓展了应用边界。