ARTICLE
多项Logit模型
多项Logit模型 (Multinomial Logit Model) 多项Logit模型(Multinomial Logit,简称 MNL)是离散选择模型中处理无序多类别选择问题的基准模型。当决策者面临三个或更多互斥且无自然排序的选项时——例如通勤者选择公交、地铁、私家车或自行车出行,消费者在多个品牌间做购买决策,劳动者在多个职业类别中选择——多项Logi
多项Logit模型 (Multinomial Logit Model)
多项Logit模型(Multinomial Logit,简称 MNL)是离散选择模型中处理无序多类别选择问题的基准模型。当决策者面临三个或更多互斥且无自然排序的选项时——例如通勤者选择公交、地铁、私家车或自行车出行,消费者在多个品牌间做购买决策,劳动者在多个职业类别中选择——多项Logit模型通过随机效用最大化(Random Utility Maximization, RUM)框架,为每一个替代方案赋予一个概率,该概率取决于方案的特征(attributes)与决策者特征(characteristics)。
随机效用框架与推导
多项Logit模型的理论基础是随机效用模型。假设决策者 在面对 个互斥替代方案时,从方案 获得的效用为:
其中 是代表性效用(representative utility)——由可观测的方案属性与决策者特征构成的线性预测子, 是随机效用成分——捕捉不可观测因素和测量误差。决策者选择使其效用最大化的方案。
McFadden(1974)的关键洞见是:假设所有 独立且服从标准I型极值分布(Gumbel分布,又称第一类极值分布),其累积分布函数为 。在此假设下,决策者 选择方案 的概率具有简洁的闭式解析表达:
该式即为多项Logit模型的核心公式。分母是所有方案指数效用的总和,保证概率之和为 1。指数形式源自I型极值分布的矩母函数性质,使得任意两个方案的选择概率比仅取决于二者的效用差。
IIA性质及其含义
多项Logit模型最显著也最具争议的特征是无关替代方案的独立性(Independence of Irrelevant Alternatives, IIA)。根据IIA,任意两个方案的选择概率比率 仅取决于方案 和 的效用,不受选择集中其他方案存在与否的影响。
IIA既是优势也是局限。优势在于:当需要预测新方案的引入效果时,仅需计算该新方案的效用并插入概率公式,所有现有方案的概率按比例收缩——这大幅简化了预测计算和样本外推断。局限在于现实中IIA常被违背。经典的红巴士/蓝巴士悖论(Debreu, 1960)揭示了问题:假设通勤者最初平等选择小汽车(方案A)和红色巴士(方案B),各占 50\%。若引入除了颜色外完全相同的蓝色巴士(方案C),直觉上乘客应仍大致 50\% 选车、25\% 选红巴、25\% 选蓝巴。但 MNL 模型预测三者各占 1/3——因为它视红巴和蓝巴为独立的无关替代方案,而非如现实中那样认为二者是高度相似的选择。
估计与统计推断
多项Logit模型通过极大似然估计(MLE)进行估计。给定样本中各决策者的实际选择,对数似然函数为:
其中 为指示变量(若个体 选择 则为 1,否则为 0)。对数似然关于参数 是全局凹的,保证了数值优化收敛至唯一最大值。由于模型是非线性的,系数 本身不具有边际效应的直观含义。实践中报告边际效应——即某一特征变化对选择概率的影响——或对数几率比(log-odds ratio)进行解释。模型整体显著性通过似然比检验(LR test)评判,通常以仅含截距的等概率模型为基准。
扩展与替代方法
为克服IIA局限,计量经济学发展了一系列扩展模型。嵌套Logit模型(Nested Logit)将相似方案归入同一"巢"(nest),允许巢内方案间的误差项相关而巢间保持独立,例如先将红巴和蓝巴归入"公共交通"巢,再与"私家车"巢比较。混合Logit模型(Mixed Logit,或称随机参数Logit)允许偏好参数在个体间随机变化,可近似任意随机效用模型——包括完全放松IIA——但代价是需要模拟极大似然估计(MSL)等计算密集型方法。此外,当类别具有自然排序时,应使用有序Logit模型(Ordered Logit)而非多项Logit。
多项Logit模型广泛应用于交通经济学(出行方式选择)、市场营销(品牌选择建模)、劳动经济学(职业分类选择)和健康经济学(治疗方案选择)。尽管存在IIA的局限,MNL凭借其计算简便、解释直观和理论基础坚实,仍是多类别离散选择分析的起点和基准模型。McFadden因其在离散选择分析方面的贡献于2000年获得诺贝尔经济学奖,奠定了多项Logit模型在实证微观经济学中的核心地位。