ARTICLE
赤池信息准则 (Akaike Information Criterion, AIC)
赤池信息准则 (Akaike Information Criterion, AIC) 赤池信息准则(Akaike Information Criterion,AIC)是由日本统计学家赤池弘次(Hirotugu Akaike)于1974年提出的一种模型选择标准。AIC基于信息论中的Kullback-Leibler散度概念,在模型拟合优度与参数个数之间寻求平衡,
赤池信息准则 (Akaike Information Criterion, AIC)
赤池信息准则(Akaike Information Criterion,AIC)是由日本统计学家赤池弘次(Hirotugu Akaike)于1974年提出的一种模型选择标准。AIC基于信息论中的Kullback-Leibler散度概念,在模型拟合优度与参数个数之间寻求平衡,旨在从一组候选模型中选择出相对最优的模型。其核心思想为,估计一个模型所导致的信息损失可以用参数个数作为惩罚项来近似,AIC最小的模型即为信息损失最少的模型。
数学定义与推导
设 为模型拟合后的似然函数在最大似然估计 处的取值, 为模型中自由参数的个数。AIC定义为:
其中 衡量模型对数据的拟合优度:似然值越大,该项越小,拟合越好。 为针对模型复杂度的惩罚项:参数越多惩罚越大,防止过拟合。AIC通过两个分量的加总实现了偏差-方差权衡——增加参数总能改善似然似然(降低第一项),但惩罚项的增加可能使AIC上升,从而只有那些对数据拟合改善幅度超过2的参数才"值得"加入。
对于线性回归模型,AIC可等价表示为:
其中 为样本量,RSS为残差平方和。该形式在误差项服从正态分布的假设下等价于似然形式,便于在最小二乘估计框架下直接计算。
模型选择实践
使用AIC进行模型选择的步骤为:对一组候选模型分别计算AIC值,选择AIC最小的模型作为最优模型。由于AIC是一个相对比较工具而非绝对检验,其绝对数值本身并无实际意义,仅不同模型间的差值具有解释力。通常约定:与最小AIC之差在2以内的模型被视为实质等效;差值在2至7之间表明次优模型有一定支持度;差值大于10则强烈支持AIC最小的模型。
与BIC(贝叶斯信息准则)对比:BIC的惩罚项为 ,比AIC的 更严厉,在大样本下倾向于选择更简约的模型。二者的哲学基础不同:AIC以最小化Kullback-Leibler散度为目标,追求预测精度,并不假设"真实模型"存在于候选集中;BIC基于贝叶斯框架,在其他条件相同时样本量越大越偏好简单模型,在大样本下是一致的模型选择准则。
在计量经济学中的应用
在计量经济学中,AIC广泛用于以下场景:滞后阶数选择——在自回归模型或向量自回归中用以确定AR(p)或VAR(p)的滞后阶数p;变量选择——在多元线性回归中比较不同解释变量集构成模型的优劣;函数形式选择——在Box-Cox变换或非线性模型中选择适当的函数形式;方差模型阶数——在GARCH模型中确定扰动条件方差的滞后结构。
局限性与注意事项
AIC的主要局限在于:其一,AIC为渐近准则,小样本下惩罚力度可能不足导致选择偏复杂模型,此时建议使用校正版本AICc(Hurvich and Tsai, 1989);其二,AIC要求各候选模型基于同一数据集且同一因变量,不能用于比较因变量经不同变换(如对数和线性)的模型;其三,AIC是相对而非绝对标准,即使所有候选模型都劣质,AIC仍会选出其中"相对最优"者,评估模型拟合优度仍需结合残差分析和假设检验等其他诊断工具。