参数模型 (Parametric Model)
参数模型 (Parametric Model)是指用有限维参数向量 θ ∈ Θ ⊆ R k \boldsymbol{\theta} \in \Theta \subseteq \mathbb{R}^k θ ∈ Θ ⊆ R k 完全描述其数据生成过程的统计或计量经济学模型。其中 k k k 是固定的有限正整数,不随样本量 n n n 增长而变化。参数模型的核心特征在于:一旦估计出这 k k k 个参数,模型的全部概率结构便完全确定——无论是条件期望、方差函数还是完整分布,均可由这组参数唯一推导。这一设定构成了经典计量经济学推断的理论基石。
形式化定义
设观测数据为 { Y i , X i } i = 1 n \{Y_i, X_i\}_{i=1}^n { Y i , X i } i = 1 n ,参数模型假定存在参数向量 θ 0 ∈ Θ \boldsymbol{\theta}_0 \in \Theta θ 0 ∈ Θ 使得:
条件期望模型 :E [ Y i ∣ X i ] = m ( X i ; θ ) E[Y_i \mid X_i] = m(X_i; \boldsymbol{\theta}) E [ Y i ∣ X i ] = m ( X i ; θ ) ,其中函数形式 m ( ⋅ ) m(\cdot) m ( ⋅ ) 已知,仅 θ \boldsymbol{\theta} θ 待估。线性回归 m ( X i ; θ ) = X i ⊤ β m(X_i; \boldsymbol{\theta}) = X_i^\top \boldsymbol{\beta} m ( X i ; θ ) = X i ⊤ β 是典型代表。条件分布模型 :Y i ∣ X i ∼ f ( ⋅ ∣ X i ; θ ) Y_i \mid X_i \sim f(\cdot \mid X_i; \boldsymbol{\theta}) Y i ∣ X i ∼ f ( ⋅ ∣ X i ; θ ) ,其中密度 f f f 的函数形式(正态、泊松、Logistic 等)完全已知,θ \boldsymbol{\theta} θ 包含位置、尺度及可能的形状参数。联合分布模型 :( Y i , X i ) ∼ i.i.d. F ( ⋅ ; θ ) (Y_i, X_i) \stackrel{\text{i.i.d.}}{\sim} F(\cdot; \boldsymbol{\theta}) ( Y i , X i ) ∼ i.i.d. F ( ⋅ ; θ ) ,即数据和协变量的联合分布也被参数化。
参数空间 Θ \Theta Θ 通常为 R k \mathbb{R}^k R k 或其紧致子集。模型的维数 k k k 被视作固定常数——这是区分参数与非参数方法的分水岭。当 k k k 随 n n n 发散(如 k = O ( n α ) k = O(n^{\alpha}) k = O ( n α ) ),便进入高维统计 或非参数领域。
经典参数模型体系
经济学与计量经济学中,以下参数模型构成实证研究的主力工具:
线性回归模型 (Linear Regression) :Y i = X i ⊤ β + ε i Y_i = X_i^\top \boldsymbol{\beta} + \varepsilon_i Y i = X i ⊤ β + ε i ,ε i ∼ N ( 0 , σ 2 ) \varepsilon_i \sim N(0, \sigma^2) ε i ∼ N ( 0 , σ 2 ) 。参数向量 θ = ( β ⊤ , σ 2 ) ⊤ \boldsymbol{\theta} = (\boldsymbol{\beta}^\top, \sigma^2)^\top θ = ( β ⊤ , σ 2 ) ⊤ ,维度 k = dim ( β ) + 1 k = \dim(\boldsymbol{\beta}) + 1 k = dim ( β ) + 1 。在高斯-马尔可夫假定 下,OLS 估计量 β ^ \hat{\boldsymbol{\beta}} β ^ 是最佳线性无偏估计量 (BLUE)。二元选择模型 (Binary Choice) :Probit 模型假定 P ( Y i = 1 ∣ X i ) = Φ ( X i ⊤ β ) P(Y_i = 1 \mid X_i) = \Phi(X_i^\top \boldsymbol{\beta}) P ( Y i = 1 ∣ X i ) = Φ ( X i ⊤ β ) ,其中 Φ ( ⋅ ) \Phi(\cdot) Φ ( ⋅ ) 为标准正态 CDF;Logit 模型则使用 Logistic 函数 Λ ( z ) = e z / ( 1 + e z ) \Lambda(z) = e^z / (1 + e^z) Λ ( z ) = e z / ( 1 + e z ) 。两者均由有限维 β \boldsymbol{\beta} β 完全参数化。时间序列模型 :ARMA(p , q p, q p , q ) 模型 Y t = ∑ j = 1 p ϕ j Y t − j + ∑ l = 1 q ψ l ε t − l + ε t Y_t = \sum_{j=1}^p \phi_j Y_{t-j} + \sum_{l=1}^q \psi_l \varepsilon_{t-l} + \varepsilon_t Y t = ∑ j = 1 p ϕ j Y t − j + ∑ l = 1 q ψ l ε t − l + ε t 的参数向量 θ = ( ϕ 1 , … , ϕ p , ψ 1 , … , ψ q , σ ε 2 ) ⊤ \boldsymbol{\theta} = (\phi_1, \ldots, \phi_p, \psi_1, \ldots, \psi_q, \sigma^2_\varepsilon)^\top θ = ( ϕ 1 , … , ϕ p , ψ 1 , … , ψ q , σ ε 2 ) ⊤ 维度为 p + q + 1 p+q+1 p + q + 1 ,完全刻画了平稳过程的线性动态结构。扩展到ARCH 和 GARCH 族模型,其波动率的参数化设定同样属于参数框架。面板数据模型 :固定效应模型 Y i t = α i + X i t ⊤ β + ε i t Y_{it} = \alpha_i + X_{it}^\top \boldsymbol{\beta} + \varepsilon_{it} Y i t = α i + X i t ⊤ β + ε i t 和随机效应模型将个体异质性参数化——前者将 α i \alpha_i α i 视作待估参数(k k k 随 N N N 增长,属边际参数化),后者将其嵌入分布假设 α i ∼ N ( 0 , σ α 2 ) \alpha_i \sim N(0, \sigma_\alpha^2) α i ∼ N ( 0 , σ α 2 ) ,维持低维结构。结构计量模型 (Structural Models) :基于经济理论的一阶条件或贝尔曼方程导出参数化映射。例如,离散选择动态规划 模型中,效用函数参数 θ \boldsymbol{\theta} θ 通过价值函数的收缩映射决定选择概率,再利用嵌套不动点算法 (NFXP) 进行最大似然估计。
估计方法论
参数模型的估计理论围绕费希尔信息 和似然原理展开。三种主导方法构成了现代计量经济学推断的支柱:
最大似然估计 (MLE) :θ ^ MLE = arg max θ ∈ Θ ∑ i = 1 n log f ( Y i ∣ X i ; θ ) \hat{\boldsymbol{\theta}}_{\text{MLE}} = \arg\max_{\boldsymbol{\theta} \in \Theta} \sum_{i=1}^n \log f(Y_i \mid X_i; \boldsymbol{\theta}) θ ^ MLE = arg max θ ∈ Θ ∑ i = 1 n log f ( Y i ∣ X i ; θ ) 。在正则条件下,MLE 具有一致性、渐近正态性和渐近有效性——即其渐近方差达到克拉美-拉奥下界 。n ( θ ^ MLE − θ 0 ) → d N ( 0 , I ( θ 0 ) − 1 ) \sqrt{n}(\hat{\boldsymbol{\theta}}_{\text{MLE}} - \boldsymbol{\theta}_0) \xrightarrow{d} N(0, \mathcal{I}(\boldsymbol{\theta}_0)^{-1}) n ( θ ^ MLE − θ 0 ) d N ( 0 , I ( θ 0 ) − 1 ) ,其中 I ( θ 0 ) \mathcal{I}(\boldsymbol{\theta}_0) I ( θ 0 ) 为费希尔信息矩阵。广义矩估计 (GMM) :基于矩条件 E [ g ( Z i ; θ 0 ) ] = 0 E[g(Z_i; \boldsymbol{\theta}_0)] = 0 E [ g ( Z i ; θ 0 )] = 0 ,GMM 最小化二次型 θ ^ GMM = arg min θ g ˉ n ( θ ) ⊤ W n g ˉ n ( θ ) \hat{\boldsymbol{\theta}}_{\text{GMM}} = \arg\min_{\boldsymbol{\theta}} \bar{g}_n(\boldsymbol{\theta})^\top W_n \bar{g}_n(\boldsymbol{\theta}) θ ^ GMM = arg min θ g ˉ n ( θ ) ⊤ W n g ˉ n ( θ ) ,其中 g ˉ n ( θ ) = n − 1 ∑ i = 1 n g ( Z i ; θ ) \bar{g}_n(\boldsymbol{\theta}) = n^{-1} \sum_{i=1}^n g(Z_i; \boldsymbol{\theta}) g ˉ n ( θ ) = n − 1 ∑ i = 1 n g ( Z i ; θ ) 。Hansen (1982) 建立了 GMM 的大样本理论,最优权重矩阵 W n = Var ( g ( Z i ; θ 0 ) ) − 1 W_n = \text{Var}(g(Z_i; \boldsymbol{\theta}_0))^{-1} W n = Var ( g ( Z i ; θ 0 ) ) − 1 给出有效 GMM 估计。贝叶斯方法 :将 θ \boldsymbol{\theta} θ 视作随机变量,利用先验分布 π ( θ ) \pi(\boldsymbol{\theta}) π ( θ ) 和似然 f ( Data ∣ θ ) f(\text{Data} \mid \boldsymbol{\theta}) f ( Data ∣ θ ) 通过贝叶斯定理得到后验 π ( θ ∣ Data ) ∝ π ( θ ) ⋅ f ( Data ∣ θ ) \pi(\boldsymbol{\theta} \mid \text{Data}) \propto \pi(\boldsymbol{\theta}) \cdot f(\text{Data} \mid \boldsymbol{\theta}) π ( θ ∣ Data ) ∝ π ( θ ) ⋅ f ( Data ∣ θ ) 。在参数模型中,当样本量较小时,合理先验的选择至关重要;n → ∞ n \to \infty n → ∞ 时,伯恩斯坦-冯·米塞斯定理 保证后验收敛至以 MLE 为中心的渐近正态分布。最小二乘法与 GLS :在线性模型中,OLS 的特殊地位来自投影定理 ——β ^ \hat{\boldsymbol{\beta}} β ^ 是 Y Y Y 在列空间 col ( X ) \text{col}(X) col ( X ) 上的正交投影。异方差或自相关情形下,广义最小二乘 (GLS) 通过加权矩阵 Ω − 1 \Omega^{-1} Ω − 1 恢复有效性。
参数模型的根本权衡
参数模型的优劣由偏差-方差权衡 (Bias-Variance Tradeoff)所支配:
优势 :当参数假设成立时,参数估计量以 n \sqrt{n} n 速率收敛——这是统计估计的理论最优速度。置信区间和假设检验(Wald 检验、似然比检验、拉格朗日乘数检验 )均可基于有限维渐近分布精确构造。小样本下,参数模型的推断精度远高于非参数替代方案,且解释性清晰——每个参数具有明确的经济含义(弹性、边际效应、半弹性)。劣势 :模型误设风险 (model misspecification risk)是参数框架的阿喀琉斯之踵。若真实的 m ( X i ) m(X_i) m ( X i ) 不在参数族 { m ( ⋅ ; θ ) : θ ∈ Θ } \{m(\cdot; \boldsymbol{\theta}) : \boldsymbol{\theta} \in \Theta\} { m ( ⋅ ; θ ) : θ ∈ Θ } 内,则 θ ^ \hat{\boldsymbol{\theta}} θ ^ 收敛至伪真值(pseudo-true value)θ ∗ = arg min θ K L ( f 0 ∥ f θ ) \boldsymbol{\theta}^* = \arg\min_{\boldsymbol{\theta}} KL(f_0 \| f_{\boldsymbol{\theta}}) θ ∗ = arg min θ K L ( f 0 ∥ f θ ) ,且推断可能严重失准。White 的稳健标准误仅修正方差估计的一致性问题,无法治愈点估计的不一致性。
模型选择与诊断
参数模型的设定检验构成实证研究的关键步骤:
嵌套检验 :似然比统计量 L R = 2 ( log L unrestricted − log L restricted ) → d χ q 2 LR = 2(\log L_{\text{unrestricted}} - \log L_{\text{restricted}}) \xrightarrow{d} \chi^2_q L R = 2 ( log L unrestricted − log L restricted ) d χ q 2 ,其中 q q q 为约束个数。Wald 检验和拉格朗日乘数检验提供渐近等价的一阶近似。非嵌套检验 :Davidson-MacKinnon J 检验和Vuong 检验分别处理回归模型和非线性模型的非嵌套比较。基本思路为检验某个模型是否包含另一模型无法捕捉的系统信息。信息准则 :AIC(赤池信息准则 ,AIC = − 2 log L + 2 k \text{AIC} = -2\log L + 2k AIC = − 2 log L + 2 k )和 BIC(贝叶斯信息准则 ,BIC = − 2 log L + k log n \text{BIC} = -2\log L + k\log n BIC = − 2 log L + k log n )在拟合优度与模型复杂度间做显式权衡。BIC 对过参数化惩罚更重,在大样本下具备模型选择一致性;AIC 旨在最小化预测误差,倾向于更复杂模型。残差诊断 :图示方法(Q-Q 图、残差-拟合值散点图)和正式检验(Jarque-Bera 正态性检验、Breusch-Pagan 异方差检验、Durbin-Watson 自相关检验)组成多层次的模型验证体系。需要注意的是,诊断检验本身也有功效和水平问题,多重检验的累积第一类错误需谨慎控制。
与非参数和半参数方法的比较
参数模型位于方法论谱系的一端,其对立面为非参数模型(完全不设定函数形式)和半参数模型(部分参数化):
非参数模型 :如核密度估计 f ^ ( x ) = ( n h ) − 1 ∑ i = 1 n K ( ( x − X i ) / h ) \hat{f}(x) = (nh)^{-1} \sum_{i=1}^n K((x - X_i)/h) f ^ ( x ) = ( nh ) − 1 ∑ i = 1 n K (( x − X i ) / h ) ,其"参数"数量本质上是样本量 n n n ——带宽 h h h 的选择决定了有效自由度。收敛速度为 O ( n − 2 / 5 ) O(n^{-2/5}) O ( n − 2/5 ) (一维核回归),慢于参数模型的 O ( n − 1 / 2 ) O(n^{-1/2}) O ( n − 1/2 ) ,且遭遇维度灾难 ——多维下收敛速度以 n − 2 / ( 4 + d ) n^{-2/(4+d)} n − 2/ ( 4 + d ) 的速率急剧下降。半参数模型 :结合参数和非参数组件。部分线性模型 Y i = X i ⊤ β + g ( Z i ) + ε i Y_i = X_i^\top \boldsymbol{\beta} + g(Z_i) + \varepsilon_i Y i = X i ⊤ β + g ( Z i ) + ε i 中,β \boldsymbol{\beta} β 以 n \sqrt{n} n 速率收敛,而未知函数 g ( ⋅ ) g(\cdot) g ( ⋅ ) 以非参数速率收敛。Robinson 差分估计量利用条件期望的迭代消除非参数部分的影响,使 β \boldsymbol{\beta} β 的参数估计达到根-n 一致性。另如Cox 比例风险模型 ,基准风险函数 h 0 ( t ) h_0(t) h 0 ( t ) 完全非参数化,而协变量效应以参数形式 exp ( X i ⊤ β ) \exp(X_i^\top \boldsymbol{\beta}) exp ( X i ⊤ β ) 进入。自适应与机器学习前沿 :LASSO (L 1 L_1 L 1 惩罚)、弹性网 、随机森林 和梯度提升 等方法模糊了传统分类——它们包含大量参数但在估计中施加正则化或结构约束。双重机器学习 (Double/Debiased Machine Learning, DML)通过Neyman 正交矩 和交叉拟合,使高维机器学习模型在参数目标量(如平均处理效应)的 n \sqrt{n} n 一致推断中担当辅助角色。
当代议题与反思
参数模型在现代计量经济学中面临两个方向的张力。一方面是复制危机 引发的对 p p p 值和假设检验体系的普遍反思——参数模型框架下的统计显著性与经济显著性的背离、p p p -hacking 和出版偏倚侵蚀了推断的可信度。另一方面,大数据的兴起使得非参数机器学习方法在预测任务上表现出色,但经济学中的核心任务——因果推断和反事实分析——仍然严重依赖结构参数模型的可解释性和理论内嵌性。计量经济学可信性革命 (Credibility Revolution)强调研究设计(工具变量 、断点回归 、双重差分 、合成控制 )优于统计模型的形式灵活性,这一趋势并未淘汰参数模型,而是将其重新定位为在透明识别策略框架下的核心推断工具。参数模型的未来不在于参数数量的增长,而在于与稳健推断、识别策略和经济理论之间更深刻的融合。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。