ARTICLE

决策论

决策论（Decision Theory）是研究个体与组织在不确定条件下如何做出最优选择的学科，横跨经济学、统计学与心理学三大领域。决策论兼具描述性与规范性双重面向：描述性决策论考察人们在现实中如何实际决策，揭示各种系统性的行为偏差；规范性决策论则从理性假设出发，推演理想决策者"应当"遵循的规则体系。该理论为博弈论、金融学、运筹学及人工智能等应用领域提供了基础

浏览 0 更新 2026-05-26

决策论（Decision Theory）是研究个体与组织在不确定条件下如何做出最优选择的学科，横跨经济学、统计学与心理学三大领域。决策论兼具描述性与规范性双重面向：描述性决策论考察人们在现实中如何实际决策，揭示各种系统性的行为偏差；规范性决策论则从理性假设出发，推演理想决策者"应当"遵循的规则体系。该理论为博弈论、金融学、运筹学及人工智能等应用领域提供了基础性的分析框架。

决策的基本要素

任何决策问题均可分解为三个核心构件。其一是备选方案，即决策者可采取的行动集合。其二是自然状态，即决策者无法控制的外部环境状况——例如在投资决策中，市场可能呈现繁荣、平稳或衰退三种状态。其三是结果，亦称支付，指每种行动在每种自然状态下产生的最终后果。备选方案、自然状态与结果三者共同构成决策问题的基本结构，在数学上表示为支付矩阵形式。

决策的分类

依据决策者对自然状态信息的掌握程度，决策问题分属三种类型。确定性决策假定决策者完全知晓何种状态将会发生，此时只须比较各方案的确定结果，属于经典最优化问题。风险性决策假定决策者虽不知道确切状态，但掌握各状态发生的概率分布。冯·诺伊曼与摩根斯特恩于1944年创立的期望效用理论为风险决策提供了公理化基准：理性决策者应选择使期望效用最大化的方案，即各状态下效用与概率乘积之和的最大值。不确定性决策则假定决策者连概率分布也无从知晓，此时须借助辅助准则来权衡：极小化极大准则要求在最坏情形中最大化收益，适合风险规避者；极大化极大准则追求最好情形中的最优结果，适合风险偏好者；最小化遗憾准则由萨维奇提出，力求最小化机会损失带来的后悔。

期望效用理论

期望效用理论是决策论的基石。它以效用函数来度量决策者对结果的主观偏好——更高效用意味着更受偏好，效用函数的凹凸性质刻画了决策者的风险态度。凹效用函数对应风险规避，决策者宁可接受确定性的等价收益也不愿参与具有相同期望值的赌博；凸函数对应风险追求，决策者为博取高收益而甘愿承担风险；线性函数则代表风险中性，决策者仅关心期望值。冯·诺伊曼与摩根斯特恩证明了四条理性公理——完备性、传递性、独立性与连续性——若决策者的偏好满足这些公理，则可构造效用函数使其决策等价于最大化期望效用。

对期望效用理论的挑战

大量实验证据表明，真实人类决策系统地偏离期望效用理论的预测。阿莱悖论与埃尔斯伯格悖论是最著名的反例：人们在面对确定收益时倾向于风险规避，面对确定损失时则转向风险追求，这种偏好逆转无法用期望效用理论解释。卡尼曼与特沃斯基于1979年提出的前景理论为这些现象提供了更具解释力的框架。前景理论的核心洞见包括：参照依赖——人们评判结果时关注的是相对于参照点的损益而非绝对财富；损失厌恶——同等损失的痛苦约是同等收益快乐的两倍；敏感性递减——收益区域表现为风险规避，损失区域表现为风险追求，形成S形价值函数；概率权重扭曲——人们倾向于高估小概率事件而低估中高概率事件，导致对罕见事件的过度反应。卡尼曼因此获2002年诺贝尔经济学奖。

贝叶斯决策理论与序贯决策

贝叶斯决策理论将先验信息与样本数据相结合，借助贝叶斯定理更新决策者对自然状态的信念。决策者首先设定先验分布，观测数据后计算后验分布，再以后验期望损失最小化为标准选择最优行动。这一框架在机器学习的贝叶斯分类器与强化学习的汤普森采样算法中均有应用。现实中的决策常常是序贯做出的——当前决策会影响未来的状态与可行选择。动态规划通过贝尔曼最优性原理求解此类问题：无论初始状态与初始决策如何，从下一阶段起的最优决策必然构成全局最优策略。这一原理构成了强化学习与最优控制的理论基础。

群体决策

当多个决策者共同做出选择时，阿罗不可能定理揭示了一个深刻的困境：在三个及以上备选方案面前，不存在任何投票机制能够同时满足帕累托最优、无独裁性、独立于无关方案和全域性这四个看似合理的条件。这一结论对政治学与社会选择理论产生了深远影响。

决策论的应用

决策论在诸多领域具有广泛的应用价值。在金融投资中，现代投资组合理论运用期望效用框架进行资产配置，期权定价模型基于风险中性概率评估衍生品价值。在医疗诊断中，决策树与马尔可夫决策过程辅助医生在不确定条件下制定治疗方案，权衡疗效与副作用之间的取舍。在人工智能领域，强化学习算法直接继承动态规划与贝尔曼方程的思想，使智能体在交互环境中学习最优策略。在公共政策方面，成本效益分析与多准则决策分析帮助政府评估基础设施投资、环境规制等重大决策的社会福利效应。决策论既为理性选择提供了规范性基准，也揭示了人类决策的系统性偏差，在人工智能与人机交互领域具有重要的理论意义与应用价值。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。