ARTICLE

赤池信息准则 (Akaike Information Criterion, AIC)

赤池信息准则 (Akaike Information Criterion, AIC) 赤池信息准则(Akaike Information Criterion,AIC)是由日本统计学家赤池弘次(Hirotugu Akaike)于1974年提出的一种模型选择标准。AIC基于信息论中的Kullback-Leibler散度概念,在模型拟合优度与参数个数之间寻求平衡,

浏览 0 更新 2025-10-26

赤池信息准则 (Akaike Information Criterion, AIC)

赤池信息准则(Akaike Information Criterion,AIC)是由日本统计学家赤池弘次(Hirotugu Akaike)于1974年提出的一种模型选择标准。AIC基于信息论中的Kullback-Leibler散度概念,在模型拟合优度与参数个数之间寻求平衡,旨在从一组候选模型中选择出相对最优的模型。其核心思想为,估计一个模型所导致的信息损失可以用参数个数作为惩罚项来近似,AIC最小的模型即为信息损失最少的模型。

数学定义与推导

L(θ^y)L(\hat{\theta}|y) 为模型拟合后的似然函数最大似然估计 θ^\hat{\theta} 处的取值,kk 为模型中自由参数的个数。AIC定义为:

AIC=2lnL(θ^y)+2k\text{AIC} = -2 \ln L(\hat{\theta}|y) + 2k

其中 2lnL(θ^y)-2 \ln L(\hat{\theta}|y) 衡量模型对数据的拟合优度:似然值越大,该项越小,拟合越好。2k2k 为针对模型复杂度的惩罚项:参数越多惩罚越大,防止过拟合。AIC通过两个分量的加总实现了偏差-方差权衡——增加参数总能改善似然似然(降低第一项),但惩罚项的增加可能使AIC上升,从而只有那些对数据拟合改善幅度超过2的参数才"值得"加入。

对于线性回归模型,AIC可等价表示为:

AIC=nln(RSSn)+2k\text{AIC} = n \ln\left(\frac{\text{RSS}}{n}\right) + 2k

其中 nn 为样本量,RSS为残差平方和。该形式在误差项服从正态分布的假设下等价于似然形式,便于在最小二乘估计框架下直接计算。

模型选择实践

使用AIC进行模型选择的步骤为:对一组候选模型分别计算AIC值,选择AIC最小的模型作为最优模型。由于AIC是一个相对比较工具而非绝对检验,其绝对数值本身并无实际意义,仅不同模型间的差值具有解释力。通常约定:与最小AIC之差在2以内的模型被视为实质等效;差值在2至7之间表明次优模型有一定支持度;差值大于10则强烈支持AIC最小的模型。

BIC(贝叶斯信息准则)对比:BIC的惩罚项为 klnnk \ln n,比AIC的 2k2k 更严厉,在大样本下倾向于选择更简约的模型。二者的哲学基础不同:AIC以最小化Kullback-Leibler散度为目标,追求预测精度,并不假设"真实模型"存在于候选集中;BIC基于贝叶斯框架,在其他条件相同时样本量越大越偏好简单模型,在大样本下是一致的模型选择准则。

在计量经济学中的应用

计量经济学中,AIC广泛用于以下场景:滞后阶数选择——在自回归模型向量自回归中用以确定AR(p)或VAR(p)的滞后阶数p;变量选择——在多元线性回归中比较不同解释变量集构成模型的优劣;函数形式选择——在Box-Cox变换或非线性模型中选择适当的函数形式;方差模型阶数——在GARCH模型中确定扰动条件方差的滞后结构。

局限性与注意事项

AIC的主要局限在于:其一,AIC为渐近准则,小样本下惩罚力度可能不足导致选择偏复杂模型,此时建议使用校正版本AICc(Hurvich and Tsai, 1989)AICc=AIC+2k(k+1)nk1\text{AICc} = \text{AIC} + \frac{2k(k+1)}{n-k-1};其二,AIC要求各候选模型基于同一数据集且同一因变量,不能用于比较因变量经不同变换(如对数和线性)的模型;其三,AIC是相对而非绝对标准,即使所有候选模型都劣质,AIC仍会选出其中"相对最优"者,评估模型拟合优度仍需结合残差分析假设检验等其他诊断工具。