ARTICLE

多项Logit模型

多项Logit模型 (Multinomial Logit Model) 多项Logit模型(Multinomial Logit,简称 MNL)是离散选择模型中处理无序多类别选择问题的基准模型。当决策者面临三个或更多互斥且无自然排序的选项时——例如通勤者选择公交、地铁、私家车或自行车出行,消费者在多个品牌间做购买决策,劳动者在多个职业类别中选择——多项Logi

浏览 6 更新 2025-10-29

多项Logit模型 (Multinomial Logit Model)

多项Logit模型(Multinomial Logit,简称 MNL)是离散选择模型中处理无序多类别选择问题的基准模型。当决策者面临三个或更多互斥且无自然排序的选项时——例如通勤者选择公交、地铁、私家车或自行车出行,消费者在多个品牌间做购买决策,劳动者在多个职业类别中选择——多项Logit模型通过随机效用最大化(Random Utility Maximization, RUM)框架,为每一个替代方案赋予一个概率,该概率取决于方案的特征(attributes)与决策者特征(characteristics)。

随机效用框架与推导

多项Logit模型的理论基础是随机效用模型。假设决策者 ii 在面对 JJ 个互斥替代方案时,从方案 jj 获得的效用为:

Uij=Vij+εijU_{ij} = V_{ij} + \varepsilon_{ij}

其中 Vij=xijβV_{ij} = \mathbf{x}_{ij}'\boldsymbol{\beta}代表性效用(representative utility)——由可观测的方案属性与决策者特征构成的线性预测子,εij\varepsilon_{ij}随机效用成分——捕捉不可观测因素和测量误差。决策者选择使其效用最大化的方案。

McFadden(1974)的关键洞见是:假设所有 εij\varepsilon_{ij} 独立且服从标准I型极值分布(Gumbel分布,又称第一类极值分布),其累积分布函数为 F(ε)=eeεF(\varepsilon) = e^{-e^{-\varepsilon}}。在此假设下,决策者 ii 选择方案 jj 的概率具有简洁的闭式解析表达:

Pij=eVijk=1JeVikP_{ij} = \frac{e^{V_{ij}}}{\sum_{k=1}^{J} e^{V_{ik}}}

该式即为多项Logit模型的核心公式。分母是所有方案指数效用的总和,保证概率之和为 1。指数形式源自I型极值分布的矩母函数性质,使得任意两个方案的选择概率比仅取决于二者的效用差。

IIA性质及其含义

多项Logit模型最显著也最具争议的特征是无关替代方案的独立性(Independence of Irrelevant Alternatives, IIA)。根据IIA,任意两个方案的选择概率比率 PijPik\frac{P_{ij}}{P_{ik}} 仅取决于方案 jjkk 的效用,不受选择集中其他方案存在与否的影响。

IIA既是优势也是局限。优势在于:当需要预测新方案的引入效果时,仅需计算该新方案的效用并插入概率公式,所有现有方案的概率按比例收缩——这大幅简化了预测计算和样本外推断。局限在于现实中IIA常被违背。经典的红巴士/蓝巴士悖论(Debreu, 1960)揭示了问题:假设通勤者最初平等选择小汽车(方案A)和红色巴士(方案B),各占 50\%。若引入除了颜色外完全相同的蓝色巴士(方案C),直觉上乘客应仍大致 50\% 选车、25\% 选红巴、25\% 选蓝巴。但 MNL 模型预测三者各占 1/3——因为它视红巴和蓝巴为独立的无关替代方案,而非如现实中那样认为二者是高度相似的选择。

估计与统计推断

多项Logit模型通过极大似然估计(MLE)进行估计。给定样本中各决策者的实际选择,对数似然函数为:

lnL(β)=i=1Nj=1JdijlnPij(β)\ln L(\boldsymbol{\beta}) = \sum_{i=1}^{N} \sum_{j=1}^{J} d_{ij} \ln P_{ij}(\boldsymbol{\beta})

其中 dijd_{ij} 为指示变量(若个体 ii 选择 jj 则为 1,否则为 0)。对数似然关于参数 β\boldsymbol{\beta} 是全局凹的,保证了数值优化收敛至唯一最大值。由于模型是非线性的,系数 β\boldsymbol{\beta} 本身不具有边际效应的直观含义。实践中报告边际效应——即某一特征变化对选择概率的影响——或对数几率比(log-odds ratio)进行解释。模型整体显著性通过似然比检验(LR test)评判,通常以仅含截距的等概率模型为基准。

扩展与替代方法

为克服IIA局限,计量经济学发展了一系列扩展模型。嵌套Logit模型(Nested Logit)将相似方案归入同一"巢"(nest),允许巢内方案间的误差项相关而巢间保持独立,例如先将红巴和蓝巴归入"公共交通"巢,再与"私家车"巢比较。混合Logit模型(Mixed Logit,或称随机参数Logit)允许偏好参数在个体间随机变化,可近似任意随机效用模型——包括完全放松IIA——但代价是需要模拟极大似然估计(MSL)等计算密集型方法。此外,当类别具有自然排序时,应使用有序Logit模型(Ordered Logit)而非多项Logit。

多项Logit模型广泛应用于交通经济学(出行方式选择)、市场营销(品牌选择建模)、劳动经济学(职业分类选择)和健康经济学(治疗方案选择)。尽管存在IIA的局限,MNL凭借其计算简便、解释直观和理论基础坚实,仍是多类别离散选择分析的起点和基准模型。McFadden因其在离散选择分析方面的贡献于2000年获得诺贝尔经济学奖,奠定了多项Logit模型在实证微观经济学中的核心地位。