ARTICLE

多项Logit模型

多项Logit模型 (Multinomial Logit Model) 多项Logit模型（Multinomial Logit，简称 MNL）是离散选择模型中处理无序多类别选择问题的基准模型。当决策者面临三个或更多互斥且无自然排序的选项时——例如通勤者选择公交、地铁、私家车或自行车出行，消费者在多个品牌间做购买决策，劳动者在多个职业类别中选择——多项Logi

浏览 6 更新 2025-10-29

多项Logit模型 (Multinomial Logit Model)

多项Logit模型（Multinomial Logit，简称 MNL）是离散选择模型中处理无序多类别选择问题的基准模型。当决策者面临三个或更多互斥且无自然排序的选项时——例如通勤者选择公交、地铁、私家车或自行车出行，消费者在多个品牌间做购买决策，劳动者在多个职业类别中选择——多项Logit模型通过随机效用最大化（Random Utility Maximization, RUM）框架，为每一个替代方案赋予一个概率，该概率取决于方案的特征（attributes）与决策者特征（characteristics）。

随机效用框架与推导

多项Logit模型的理论基础是随机效用模型。假设决策者 $i$ 在面对 $J$ 个互斥替代方案时，从方案 $j$ 获得的效用为：

U_{ij} = V_{ij} + \varepsilon_{ij}

其中 $V_{ij} = \mathbf{x}_{ij}'\boldsymbol{\beta}$ 是代表性效用（representative utility）——由可观测的方案属性与决策者特征构成的线性预测子， $\varepsilon_{ij}$ 是随机效用成分——捕捉不可观测因素和测量误差。决策者选择使其效用最大化的方案。

McFadden（1974）的关键洞见是：假设所有 $\varepsilon_{ij}$ 独立且服从标准I型极值分布（Gumbel分布，又称第一类极值分布），其累积分布函数为 $F(\varepsilon) = e^{-e^{-\varepsilon}}$ 。在此假设下，决策者 $i$ 选择方案 $j$ 的概率具有简洁的闭式解析表达：

P_{ij} = \frac{e^{V_{ij}}}{\sum_{k=1}^{J} e^{V_{ik}}}

该式即为多项Logit模型的核心公式。分母是所有方案指数效用的总和，保证概率之和为 1。指数形式源自I型极值分布的矩母函数性质，使得任意两个方案的选择概率比仅取决于二者的效用差。

IIA性质及其含义

多项Logit模型最显著也最具争议的特征是无关替代方案的独立性（Independence of Irrelevant Alternatives, IIA）。根据IIA，任意两个方案的选择概率比率 $\frac{P_{ij}}{P_{ik}}$ 仅取决于方案 $j$ 和 $k$ 的效用，不受选择集中其他方案存在与否的影响。

IIA既是优势也是局限。优势在于：当需要预测新方案的引入效果时，仅需计算该新方案的效用并插入概率公式，所有现有方案的概率按比例收缩——这大幅简化了预测计算和样本外推断。局限在于现实中IIA常被违背。经典的红巴士/蓝巴士悖论（Debreu, 1960）揭示了问题：假设通勤者最初平等选择小汽车（方案A）和红色巴士（方案B），各占 50\%。若引入除了颜色外完全相同的蓝色巴士（方案C），直觉上乘客应仍大致 50\% 选车、25\% 选红巴、25\% 选蓝巴。但 MNL 模型预测三者各占 1/3——因为它视红巴和蓝巴为独立的无关替代方案，而非如现实中那样认为二者是高度相似的选择。

估计与统计推断

多项Logit模型通过极大似然估计（MLE）进行估计。给定样本中各决策者的实际选择，对数似然函数为：

\ln L(\boldsymbol{\beta}) = \sum_{i=1}^{N} \sum_{j=1}^{J} d_{ij} \ln P_{ij}(\boldsymbol{\beta})

其中 $d_{ij}$ 为指示变量（若个体 $i$ 选择 $j$ 则为 1，否则为 0）。对数似然关于参数 $\boldsymbol{\beta}$ 是全局凹的，保证了数值优化收敛至唯一最大值。由于模型是非线性的，系数 $\boldsymbol{\beta}$ 本身不具有边际效应的直观含义。实践中报告边际效应——即某一特征变化对选择概率的影响——或对数几率比（log-odds ratio）进行解释。模型整体显著性通过似然比检验（LR test）评判，通常以仅含截距的等概率模型为基准。

扩展与替代方法

为克服IIA局限，计量经济学发展了一系列扩展模型。嵌套Logit模型（Nested Logit）将相似方案归入同一"巢"（nest），允许巢内方案间的误差项相关而巢间保持独立，例如先将红巴和蓝巴归入"公共交通"巢，再与"私家车"巢比较。混合Logit模型（Mixed Logit，或称随机参数Logit）允许偏好参数在个体间随机变化，可近似任意随机效用模型——包括完全放松IIA——但代价是需要模拟极大似然估计（MSL）等计算密集型方法。此外，当类别具有自然排序时，应使用有序Logit模型（Ordered Logit）而非多项Logit。

多项Logit模型广泛应用于交通经济学（出行方式选择）、市场营销（品牌选择建模）、劳动经济学（职业分类选择）和健康经济学（治疗方案选择）。尽管存在IIA的局限，MNL凭借其计算简便、解释直观和理论基础坚实，仍是多类别离散选择分析的起点和基准模型。McFadden因其在离散选择分析方面的贡献于2000年获得诺贝尔经济学奖，奠定了多项Logit模型在实证微观经济学中的核心地位。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。