ARTICLE

决策理论

决策理论 (Decision Theory) 决策理论综合数学、统计学、经济学和管理科学,为决策者在不确定环境中做最优选择提供系统理性框架。规范性(理性人应如何决策)vs 描述性(人实际如何决策,行为经济学)。 三要素:行动集合 A = \A_1, , A_m\、自然状态 S = \S_1, , S_n\、收益 O_ij——组织于收益矩阵。 不确定性下的决策

浏览 58 更新 2025-10-26

决策理论 (Decision Theory)

决策理论综合数学统计学经济学和管理科学,为决策者在不确定环境中做最优选择提供系统理性框架。规范性(理性人应如何决策)vs 描述性(人实际如何决策,行为经济学)。

三要素:行动集合 A={A1,,Am}A = \{A_1, \dots, A_m\}、自然状态 S={S1,,Sn}S = \{S_1, \dots, S_n\}、收益 OijO_{ij}——组织于收益矩阵

不确定性下的决策准则(概率未知)

  • 最大最大收益 (Maximax):乐观,选"最好中的最好" → maximaxjOij\max_i \max_j O_{ij}
  • 最大最小收益 (Maximin/Wald):悲观/保守,选"最坏中的最好" → maximinjOij\max_i \min_j O_{ij}
  • 最小最大后悔值 (Minimax Regret/Savage):后悔值 Rij=maxkOkjOijR_{ij} = \max_k O_{kj} - O_{ij},选 minimaxjRij\min_i \max_j R_{ij}
  • 赫维茨准则:折中,H(Ai)=αmaxjOij+(1α)minjOijH(A_i) = \alpha \cdot \max_j O_{ij} + (1-\alpha) \cdot \min_j O_{ij}α[0,1]\alpha \in [0,1]
  • 拉普拉斯准则:等可能,计算等概率期望值

风险下的决策准则(概率已知)

期望货币价值(EMV):EMV(Ai)=P(Sj)OijEMV(A_i) = \sum P(S_j) \cdot O_{ij},选最大EMV。期望机会损失(EOL)最小化的行动等价于最大化EMV的行动。

完美信息的期望价值(EVPI):EVPI=EVwPImaxiEMV(Ai)EVPI = EVwPI - \max_i EMV(A_i),其中 EVwPI=P(Sj)maxkOkjEVwPI = \sum P(S_j) \cdot \max_k O_{kj}。EVPI = 最优行动的EOL。

效用理论超越EMV:因风险规避,用效用函数 U(x)U(x)U<0U'' < 0凹=风避、U=0U'' = 0线性=风中性、U>0U'' > 0凸=风偏好)替代直接货币收益,最大化期望效用EU(Ai)=P(Sj)U(Oij)EU(A_i) = \sum P(S_j) \cdot U(O_{ij})