ARTICLE
先验信息
先验信息 (Prior Information) 先验信息→贝叶斯统计中的核心概念→指在观测当前数据之前已经掌握的有关参数 的全部知识、信念或经验证据。它通过先验分布(prior distribution) ( )被形式化地纳入贝叶斯定理→与样本信息(似然函数)结合后形成后验分布 ( x) L( x) \, ( )→实现对参数不确定性的更新。先验信息的来源、
先验信息 (Prior Information)
先验信息→贝叶斯统计中的核心概念→指在观测当前数据之前已经掌握的有关参数的全部知识、信念或经验证据。它通过先验分布(prior distribution)被形式化地纳入贝叶斯定理→与样本信息(似然函数)结合后形成后验分布→实现对参数不确定性的更新。先验信息的来源、表达及合理性构成了频率学派与贝叶斯学派之间最深刻的哲学与方法论分歧。
来源与分类
先验信息主要有四种来源:
- 主观信念→研究者根据理论预期或个人判断设定先验→如预期某个价格弹性应在区间内→反映"合理的"经济学直觉。
- 历史数据/元分析→从以往同类研究、元分析或相似市场的数据中提炼→如新药二期试验可用一期结果构造先验→实现证据的累积与再利用。
- 理论约束→经济理论施加的符号或范围限制→如需求定律要求自身价格效应为负→可编码为截断先验→保证后验估计符合理论预期。
- 无信息/默认先验→当缺乏实质性先验知识时→采用Jeffreys先验、均匀先验等→让数据主导推断→但"无信息"的定义本身依赖于参数化方式。
先验分布的类型
共轭先验:若先验与后验属于同一分布族→则称该先验为似然函数的共轭先验→计算简便→是贝叶斯分析中常用的解析工具。典型配对:正态分布均值(方差已知)←共轭→正态先验;二项分布成功概率←共轭→Beta分布;泊松分布速率←共轭→Gamma分布。共轭先验在计算上便利→但可能限制先验的表达灵活性。
层级先验:当代贝叶斯建模中→先验本身可含未知超参数→再为超参数设超先验→形成层级结构→。层级贝叶斯模型在面板数据随机效应、多水平模型及机器学习中极为普遍→允许不同组别参数相互借力(shrinkage)→如教育增值模型中→各学校的效应估计向整体均值收缩→减少小样本学校的极端值。
非共轭先验与MCMC:现代计算技术(马尔可夫链蒙特卡洛)使非共轭先验的估计成为可能→研究者可灵活设定任意形式的先验而不受解析可处理性约束→极大拓展了贝叶斯方法的应用空间。
先验信息的表达:先验选择与敏感性分析
先验的选择是贝叶斯分析中最需谨慎的步骤:
先验诱导→从领域专家处系统提取先验知识的规范化流程:通过询问分位数、最可能区间等→拟合为参数化分布→常用工具包括Sheffield先验诱导框架。先验敏感性分析→改变先验设定的关键参数(如先验方差)→检查后验结论是否发生实质性变化→若后验对先验的合理变动不敏感→结论更稳健可信→若敏感→须明确报告先验对推断的驱动程度。先验预测检验→从先验分布中模拟生成数据→检查模拟数据是否与背景知识一致→避免隐含荒谬预测的先验设定。
经济学与计量中的应用
DSGE模型估计:动态随机一般均衡模型参数众多而样本有限→贝叶斯估计允许研究者通过先验纳入微观实证证据(如消费的跨期替代弹性来自家庭调查)→缓解识别不足。微观计量:随机系数离散选择模型(如BLP需求估计)常使用层次先验约束参数空间→避免过拟合。政策评估:回归间断与合成控制法的贝叶斯版本可纳入关于处理效应符号的先验→提高小样本下的推断精度。金融:资产定价中的随机波动率模型将波动率的持续性先验与收益率数据结合→改善波动预测。
争议与回应
频率学派的核心质疑:先验信息引入主观性→不同研究者可能因先验选择不同而得出不同结论→损害科学的客观性。贝叶斯回应:一. 所有统计模型都包含主观选择(如显著性水平同样是约定→非客观真理)→贝叶斯框架仅让主观性更透明;二. 大样本下先验影响渐趋消失(Bernstein–von Mises定理)→后验渐近独立于先验;三. 先验敏感性分析使先验影响可量化、可讨论→非隐蔽。实践中→稳健贝叶斯分析通过先验集合而非单点先验表达不确定性→已成为调和主观性与客观性的重要方法论框架。
核心理念:先验信息不是贝叶斯方法的缺陷→而是对研究者必然拥有背景知识这一事实的诚实形式化→其规范使用要求透明度、敏感性与可复现性。