ARTICLE

参数模型

参数模型 (Parametric Model) 参数模型(Parametric Model)是指用有限维参数向量 R^k 完全描述其数据生成过程的统计或计量经济学模型。其中 k 是固定的有限正整数,不随样本量 n 增长而变化。参数模型的核心特征在于:一旦估计出这 k 个参数,模型的全部概率结构便完全确定——无论是条件期望、方差函数还是完整分布,均可由这组参数

浏览 0 更新 2026-07-11

参数模型 (Parametric Model)

参数模型(Parametric Model)是指用有限维参数向量 θΘRk \boldsymbol{\theta} \in \Theta \subseteq \mathbb{R}^k 完全描述其数据生成过程的统计或计量经济学模型。其中 k k 是固定的有限正整数,不随样本量 n n 增长而变化。参数模型的核心特征在于:一旦估计出这 k k 个参数,模型的全部概率结构便完全确定——无论是条件期望、方差函数还是完整分布,均可由这组参数唯一推导。这一设定构成了经典计量经济学推断的理论基石。

形式化定义

设观测数据为 {Yi,Xi}i=1n \{Y_i, X_i\}_{i=1}^n ,参数模型假定存在参数向量 θ0Θ \boldsymbol{\theta}_0 \in \Theta 使得:

  • 条件期望模型E[YiXi]=m(Xi;θ) E[Y_i \mid X_i] = m(X_i; \boldsymbol{\theta}) ,其中函数形式 m() m(\cdot) 已知,仅 θ \boldsymbol{\theta} 待估。线性回归 m(Xi;θ)=Xiβ m(X_i; \boldsymbol{\theta}) = X_i^\top \boldsymbol{\beta} 是典型代表。
  • 条件分布模型YiXif(Xi;θ) Y_i \mid X_i \sim f(\cdot \mid X_i; \boldsymbol{\theta}) ,其中密度 f f 的函数形式(正态、泊松、Logistic 等)完全已知,θ \boldsymbol{\theta} 包含位置、尺度及可能的形状参数。
  • 联合分布模型(Yi,Xi)i.i.d.F(;θ) (Y_i, X_i) \stackrel{\text{i.i.d.}}{\sim} F(\cdot; \boldsymbol{\theta}) ,即数据和协变量的联合分布也被参数化。

参数空间 Θ \Theta 通常为 Rk \mathbb{R}^k 或其紧致子集。模型的维数 k k 被视作固定常数——这是区分参数与非参数方法的分水岭。当 k k n n 发散(如 k=O(nα) k = O(n^{\alpha}) ),便进入高维统计或非参数领域。

经典参数模型体系

经济学与计量经济学中,以下参数模型构成实证研究的主力工具:

  1. 线性回归模型 (Linear Regression)Yi=Xiβ+εi Y_i = X_i^\top \boldsymbol{\beta} + \varepsilon_i εiN(0,σ2) \varepsilon_i \sim N(0, \sigma^2) 。参数向量 θ=(β,σ2) \boldsymbol{\theta} = (\boldsymbol{\beta}^\top, \sigma^2)^\top ,维度 k=dim(β)+1 k = \dim(\boldsymbol{\beta}) + 1 。在高斯-马尔可夫假定下,OLS 估计量 β^ \hat{\boldsymbol{\beta}} 是最佳线性无偏估计量 (BLUE)。
  2. 二元选择模型 (Binary Choice):Probit 模型假定 P(Yi=1Xi)=Φ(Xiβ) P(Y_i = 1 \mid X_i) = \Phi(X_i^\top \boldsymbol{\beta}) ,其中 Φ() \Phi(\cdot) 为标准正态 CDF;Logit 模型则使用 Logistic 函数 Λ(z)=ez/(1+ez) \Lambda(z) = e^z / (1 + e^z) 。两者均由有限维 β \boldsymbol{\beta} 完全参数化。
  3. 时间序列模型:ARMA(p,q p, q ) 模型 Yt=j=1pϕjYtj+l=1qψlεtl+εt Y_t = \sum_{j=1}^p \phi_j Y_{t-j} + \sum_{l=1}^q \psi_l \varepsilon_{t-l} + \varepsilon_t 的参数向量 θ=(ϕ1,,ϕp,ψ1,,ψq,σε2) \boldsymbol{\theta} = (\phi_1, \ldots, \phi_p, \psi_1, \ldots, \psi_q, \sigma^2_\varepsilon)^\top 维度为 p+q+1 p+q+1 ,完全刻画了平稳过程的线性动态结构。扩展到ARCH 和 GARCH 族模型,其波动率的参数化设定同样属于参数框架。
  4. 面板数据模型:固定效应模型 Yit=αi+Xitβ+εit Y_{it} = \alpha_i + X_{it}^\top \boldsymbol{\beta} + \varepsilon_{it} 和随机效应模型将个体异质性参数化——前者将 αi \alpha_i 视作待估参数(k k N N 增长,属边际参数化),后者将其嵌入分布假设 αiN(0,σα2) \alpha_i \sim N(0, \sigma_\alpha^2) ,维持低维结构。
  5. 结构计量模型 (Structural Models):基于经济理论的一阶条件或贝尔曼方程导出参数化映射。例如,离散选择动态规划模型中,效用函数参数 θ \boldsymbol{\theta} 通过价值函数的收缩映射决定选择概率,再利用嵌套不动点算法(NFXP) 进行最大似然估计。

估计方法论

参数模型的估计理论围绕费希尔信息和似然原理展开。三种主导方法构成了现代计量经济学推断的支柱:

  1. 最大似然估计 (MLE)θ^MLE=argmaxθΘi=1nlogf(YiXi;θ) \hat{\boldsymbol{\theta}}_{\text{MLE}} = \arg\max_{\boldsymbol{\theta} \in \Theta} \sum_{i=1}^n \log f(Y_i \mid X_i; \boldsymbol{\theta}) 。在正则条件下,MLE 具有一致性、渐近正态性和渐近有效性——即其渐近方差达到克拉美-拉奥下界n(θ^MLEθ0)dN(0,I(θ0)1) \sqrt{n}(\hat{\boldsymbol{\theta}}_{\text{MLE}} - \boldsymbol{\theta}_0) \xrightarrow{d} N(0, \mathcal{I}(\boldsymbol{\theta}_0)^{-1}) ,其中 I(θ0) \mathcal{I}(\boldsymbol{\theta}_0) 为费希尔信息矩阵。
  2. 广义矩估计 (GMM):基于矩条件 E[g(Zi;θ0)]=0 E[g(Z_i; \boldsymbol{\theta}_0)] = 0 ,GMM 最小化二次型 θ^GMM=argminθgˉn(θ)Wngˉn(θ) \hat{\boldsymbol{\theta}}_{\text{GMM}} = \arg\min_{\boldsymbol{\theta}} \bar{g}_n(\boldsymbol{\theta})^\top W_n \bar{g}_n(\boldsymbol{\theta}) ,其中 gˉn(θ)=n1i=1ng(Zi;θ) \bar{g}_n(\boldsymbol{\theta}) = n^{-1} \sum_{i=1}^n g(Z_i; \boldsymbol{\theta}) Hansen (1982) 建立了 GMM 的大样本理论,最优权重矩阵 Wn=Var(g(Zi;θ0))1 W_n = \text{Var}(g(Z_i; \boldsymbol{\theta}_0))^{-1} 给出有效 GMM 估计。
  3. 贝叶斯方法:将 θ \boldsymbol{\theta} 视作随机变量,利用先验分布 π(θ) \pi(\boldsymbol{\theta}) 和似然 f(Dataθ) f(\text{Data} \mid \boldsymbol{\theta}) 通过贝叶斯定理得到后验 π(θData)π(θ)f(Dataθ) \pi(\boldsymbol{\theta} \mid \text{Data}) \propto \pi(\boldsymbol{\theta}) \cdot f(\text{Data} \mid \boldsymbol{\theta}) 。在参数模型中,当样本量较小时,合理先验的选择至关重要;n n \to \infty 时,伯恩斯坦-冯·米塞斯定理保证后验收敛至以 MLE 为中心的渐近正态分布。
  4. 最小二乘法与 GLS:在线性模型中,OLS 的特殊地位来自投影定理——β^ \hat{\boldsymbol{\beta}} Y Y 在列空间 col(X) \text{col}(X) 上的正交投影。异方差或自相关情形下,广义最小二乘 (GLS) 通过加权矩阵 Ω1 \Omega^{-1} 恢复有效性。

参数模型的根本权衡

参数模型的优劣由偏差-方差权衡(Bias-Variance Tradeoff)所支配:

  • 优势:当参数假设成立时,参数估计量以 n \sqrt{n} 速率收敛——这是统计估计的理论最优速度。置信区间和假设检验(Wald 检验、似然比检验、拉格朗日乘数检验)均可基于有限维渐近分布精确构造。小样本下,参数模型的推断精度远高于非参数替代方案,且解释性清晰——每个参数具有明确的经济含义(弹性、边际效应、半弹性)。
  • 劣势模型误设风险(model misspecification risk)是参数框架的阿喀琉斯之踵。若真实的 m(Xi) m(X_i) 不在参数族 {m(;θ):θΘ} \{m(\cdot; \boldsymbol{\theta}) : \boldsymbol{\theta} \in \Theta\} 内,则 θ^ \hat{\boldsymbol{\theta}} 收敛至伪真值(pseudo-true value)θ=argminθKL(f0fθ) \boldsymbol{\theta}^* = \arg\min_{\boldsymbol{\theta}} KL(f_0 \| f_{\boldsymbol{\theta}}) ,且推断可能严重失准。White 的稳健标准误仅修正方差估计的一致性问题,无法治愈点估计的不一致性。

模型选择与诊断

参数模型的设定检验构成实证研究的关键步骤:

  1. 嵌套检验:似然比统计量 LR=2(logLunrestrictedlogLrestricted)dχq2 LR = 2(\log L_{\text{unrestricted}} - \log L_{\text{restricted}}) \xrightarrow{d} \chi^2_q ,其中 q q 为约束个数。Wald 检验和拉格朗日乘数检验提供渐近等价的一阶近似。
  2. 非嵌套检验Davidson-MacKinnon J 检验和Vuong 检验分别处理回归模型和非线性模型的非嵌套比较。基本思路为检验某个模型是否包含另一模型无法捕捉的系统信息。
  3. 信息准则:AIC(赤池信息准则AIC=2logL+2k \text{AIC} = -2\log L + 2k )和 BIC(贝叶斯信息准则BIC=2logL+klogn \text{BIC} = -2\log L + k\log n )在拟合优度与模型复杂度间做显式权衡。BIC 对过参数化惩罚更重,在大样本下具备模型选择一致性;AIC 旨在最小化预测误差,倾向于更复杂模型。
  4. 残差诊断:图示方法(Q-Q 图、残差-拟合值散点图)和正式检验(Jarque-Bera 正态性检验、Breusch-Pagan 异方差检验、Durbin-Watson 自相关检验)组成多层次的模型验证体系。需要注意的是,诊断检验本身也有功效和水平问题,多重检验的累积第一类错误需谨慎控制。

与非参数和半参数方法的比较

参数模型位于方法论谱系的一端,其对立面为非参数模型(完全不设定函数形式)和半参数模型(部分参数化):

  1. 非参数模型:如核密度估计 f^(x)=(nh)1i=1nK((xXi)/h) \hat{f}(x) = (nh)^{-1} \sum_{i=1}^n K((x - X_i)/h) ,其"参数"数量本质上是样本量 n n ——带宽 h h 的选择决定了有效自由度。收敛速度为 O(n2/5) O(n^{-2/5}) (一维核回归),慢于参数模型的 O(n1/2) O(n^{-1/2}) ,且遭遇维度灾难——多维下收敛速度以 n2/(4+d) n^{-2/(4+d)} 的速率急剧下降。
  2. 半参数模型:结合参数和非参数组件。部分线性模型 Yi=Xiβ+g(Zi)+εi Y_i = X_i^\top \boldsymbol{\beta} + g(Z_i) + \varepsilon_i 中,β \boldsymbol{\beta} n \sqrt{n} 速率收敛,而未知函数 g() g(\cdot) 以非参数速率收敛。Robinson 差分估计量利用条件期望的迭代消除非参数部分的影响,使 β \boldsymbol{\beta} 的参数估计达到根-n 一致性。另如Cox 比例风险模型,基准风险函数 h0(t) h_0(t) 完全非参数化,而协变量效应以参数形式 exp(Xiβ) \exp(X_i^\top \boldsymbol{\beta}) 进入。
  3. 自适应与机器学习前沿LASSOL1 L_1 惩罚)、弹性网随机森林梯度提升等方法模糊了传统分类——它们包含大量参数但在估计中施加正则化或结构约束。双重机器学习(Double/Debiased Machine Learning, DML)通过Neyman 正交矩和交叉拟合,使高维机器学习模型在参数目标量(如平均处理效应)的 n \sqrt{n} 一致推断中担当辅助角色。

当代议题与反思

参数模型在现代计量经济学中面临两个方向的张力。一方面是复制危机引发的对 p p 值和假设检验体系的普遍反思——参数模型框架下的统计显著性与经济显著性的背离、p p -hacking 和出版偏倚侵蚀了推断的可信度。另一方面,大数据的兴起使得非参数机器学习方法在预测任务上表现出色,但经济学中的核心任务——因果推断和反事实分析——仍然严重依赖结构参数模型的可解释性和理论内嵌性。计量经济学可信性革命(Credibility Revolution)强调研究设计(工具变量断点回归双重差分合成控制)优于统计模型的形式灵活性,这一趋势并未淘汰参数模型,而是将其重新定位为在透明识别策略框架下的核心推断工具。参数模型的未来不在于参数数量的增长,而在于与稳健推断、识别策略和经济理论之间更深刻的融合。