知经 KNOWECON · 卓越的经济金融统计数学学习平台

期望效用

# 期望效用 (Expected Utility)

期望效用理论 (Expected Utility Theory) 是一个在{{{决策论}}}、{{{经济学}}}和{{{金融学}}}中用于描述和规范化个体在不确定性条件下如何进行选择的模型。该理论指出,一个理性的决策者在面对不同结果和相应概率的风险选项(即“{{{彩票}}}”或“赌局”)时,其选择行为并非简单地最大化可能结果的期望值,而是最大化这些结果所带来的效用的期望值。

这个概念最早由数学家[[丹尼尔·伯努利]]在1738年为解决{{{圣彼得堡悖论}}}而提出,后来在20世纪40年代由数学家[[约翰·冯·诺伊曼]]和经济学家[[奥斯卡·摩根斯坦]]在其著作《博弈论与经济行为》中进行了公理化,建立了现代期望效用理论的分析框架。

## 核心思想:效用而非价值

传统的{{{期望值}}}理论认为,一个风险决策的价值等于其所有可能结果的{{{概率}}}加权平均值。然而,这常常与人们的实际行为相悖。

例如,考虑以下两个选项: * 选项A:确定性地获得 500,000 USD。 * 选项B:一个彩票,有50%的概率获得 1,000,000 USD,50%的概率一无所获。

根据{{{期望值}}}计算: * $E[A] = 1.0 \times 500,000 = 500,000$ USD * $E[B] = 0.5 \times 1,000,000 + 0.5 \times 0 = 500,000$ USD

尽管两个选项的期望值相同,但绝大多数人会选择选项A。期望效用理论解释了这种现象:人们评估的不是货币价值本身,而是货币带来的满足感或效用。由于{{{边际效用递减}}},从0增加到500,000 USD所带来的效用增量,通常会大于从500,000 USD增加到1,000,000 USD所带来的效用增量。因此,失去500,000 USD的“痛苦”大于额外获得500,000 USD的“快乐”,导致人们倾向于规避风险。

## 数学表述

期望效用理论用一个{{{效用函数}}} $u(x)$ 来表示决策者从财富或结果 $x$ 中获得的效用(或满足度)。

假设一个风险选项(或称为一个{{{彩票}}} L)包含一组互斥的可能结果 $\{x_1, x_2, \dots, x_n\}$,每个结果发生的{{{概率}}}分别为 $\{p_1, p_2, \dots, p_n\}$,且满足 $\sum_{i=1}^{n} p_i = 1$。

该彩票L的期望效用 (Expected Utility, EU) 定义为所有可能结果的效用的概率加权平均值: $$ E[u(L)] = \sum_{i=1}^{n} p_i u(x_i) $$ 对于结果是连续变量的情况(例如,财富值可以取任意正数),如果其概率分布由{{{概率密度函数}}} $f(x)$ 描述,则期望效用为: $$ E[u(x)] = \int u(x) f(x) \,dx $$ 根据期望效用理论,一个理性的决策者在多个风险选项中会选择那个能够使其期望效用最大化的选项。

## 圣彼得堡悖论与理论的起源

期望效用理论的诞生直接源于对{{{圣彼得堡悖论}}} (St. Petersburg Paradox) 的解答。该悖论描述了这样一个游戏:

> 反复投掷一枚公平的硬币,直到第一次出现正面为止。如果硬币在第 $k$ 次投掷时出现正面,则玩家获得 $2^{k-1}$ USD 的奖励。请问,一个理性的人愿意为参加这个游戏支付多少钱?

游戏的期望货币价值 (Expected Monetary Value, EMV) 计算如下: * 在第1次投掷就出现正面的概率是 $1/2$,收益为 $2^{1-1}=1$ USD。 * 在第2次投掷才出现正面的概率是 $(1/2)^2 = 1/4$,收益为 $2^{2-1}=2$ USD。 * 在第 $k$ 次投掷才出现正面的概率是 $(1/2)^k$,收益为 $2^{k-1}$ USD。

因此,游戏的期望值为: $$ E[\text{Value}] = \sum_{k=1}^{\infty} \left(\frac{1}{2}\right)^k \cdot 2^{k-1} = \sum_{k=1}^{\infty} \frac{1}{2} = \frac{1}{2} + \frac{1}{2} + \frac{1}{2} + \dots = \infty $$ 理论上的期望收益是无穷大,这意味着一个“理性”的人似乎应该愿意支付任何有限的金额来玩这个游戏。但这显然与现实不符,大多数人只愿意支付一个很小的数额。

[[丹尼尔·伯努利]]提出,人们关心的不是财富的期望值,而是财富的效用的期望值。他假设财富的边际效用是递减的,并提出了一个对数效用函数,例如 $u(x) = \ln(x)$。在这种情况下,游戏的期望效用是: $$ E[u(x)] = \sum_{k=1}^{\infty} \left(\frac{1}{2}\right)^k u(2^{k-1}) = \sum_{k=1}^{\infty} \left(\frac{1}{2}\right)^k \ln(2^{k-1}) $$ $$ E[u(x)] = \ln(2) \sum_{k=1}^{\infty} (k-1) \left(\frac{1}{2}\right)^k $$ 这是一个收敛的级数,其结果是一个有限值(等于 $\ln(2)$)。这个有限的期望效用值对应一个有限的财富水平,解释了为什么人们只愿意支付一个有限的、较小的金额来参与游戏。

## 冯·诺伊曼-摩根斯坦公理体系

冯·诺伊曼和摩根斯坦为期望效用理论提供了严格的公理化基础。他们证明,如果一个决策者的偏好满足以下四个公理,那么他的选择行为必然与最大化某个效用函数的期望值相一致。

1. 完备性 (Completeness):对于任意两个彩票A和B,决策者总能明确表示自己的偏好:要么A优于B ($A \succ B$),要么B优于A ($B \succ A$),要么对二者无差异 ($A \sim B$)。 2. 传递性 (Transitivity):如果一个决策者认为A优于B,且B优于C,那么他必然认为A优于C。即若 $A \succ B$ 且 $B \succ C$,则 $A \succ C$。 3. 连续性 (Continuity):如果 $A \succ B \succ C$,那么必然存在一个概率 $p \in (0, 1)$,使得决策者对于“确定性地获得B”和“以概率 $p$ 获得A、以概率 $1-p$ 获得C的彩票”之间无差异。这意味着偏好中不存在“无穷大”或“无穷小”的跳跃。 4. 独立性 (Independence):如果决策者认为A优于B ($A \succ B$),那么对于任意第三个彩票C和任意概率 $p \in (0, 1)$,他必然认为“以概率 $p$ 获得A、以概率 $1-p$ 获得C的复合彩票”优于“以概率 $p$ 获得B、以概率 $1-p$ 获得C的复合彩票”。简言之,将两个选项与一个不相关的第三选项混合,不应改变原始的偏好顺序。

如果决策者的偏好满足以上公理,那么存在一个{{{冯·诺伊曼-摩根斯坦效用函数}}} $u(x)$,使得决策者的行为等同于最大化期望效用。需要注意的是,这个效用函数是基数效用函数,但其唯一性仅限于正线性变换 (positive affine transformation)。也就是说,如果 $u(x)$ 是一个有效的效用函数,那么 $v(x) = a \cdot u(x) + b$ (其中 $a>0$) 也是一个等价的效用函数,代表着相同的偏好。

## 效用函数的形状与风险态度

效用函数的曲率(二阶导数)反映了决策者的{{{风险态度}}}。

* {{{风险规避}}} (Risk Aversion): * 特征:效用函数是凹函数 (Concave Function),即 $u''(x) < 0$。 * 行为:决策者偏好一个确定的回报,胜过一个具有相同期望值的风险赌局。即 $u(E[X]) > E[u(X)]$。 * 经济学含义:这是大多数人的典型行为。财富的{{{边际效用}}}是递减的,这意味着增加相同数量的财富所带来的满足感会随着已有财富的增加而减少。

* {{{风险中性}}} (Risk Neutrality): * 特征:效用函数是线性函数 (Linear Function),即 $u''(x) = 0$。 * 行为:决策者对于一个确定性回报和具有相同期望值的风险赌局无差异。即 $u(E[X]) = E[u(X)]$。 * 经济学含义:决策者只关心期望回报,不关心风险本身。其决策等同于最大化期望值。

* {{{风险偏好}}} (Risk Seeking / Risk Loving): * 特征:效用函数是凸函数 (Convex Function),即 $u''(x) > 0$。 * 行为:决策者偏好一个风险赌局,胜过一个具有相同期望值的确定性回报。即 $u(E[X]) < E[u(X)]$。 * 经济学含义:财富的边际效用是递增的。这在某些情境下可能出现,例如在赌博或面临巨大亏损时寻求翻本。

与风险态度相关的两个重要概念是{{{确定性等价物}}}和{{{风险溢价}}}。 * {{{确定性等价物}}} (Certainty Equivalent, CE):对于一个给定的风险彩票L,确定性等价物是指能让决策者感到与该彩票无差异的确定性金额。它满足 $u(\text{CE}) = E[u(L)]$。 * {{{风险溢价}}} (Risk Premium, RP):一个风险彩票的期望值与其确定性等价物之间的差额,即 $\text{RP} = E[L] - \text{CE}$。对于风险规避者,风险溢价为正,代表他愿意为了避免风险而放弃的期望收益。

## 应用与批评

应用:期望效用理论是现代{{{微观经济学}}}、{{{金融资产定价}}} (如{{{资本资产定价模型}}})、{{{保险}}}理论和{{{投资组合选择}}}理论的基石。它为分析不确定性下的经济行为提供了一个强大而统一的框架。

批评与局限:尽管期望效用理论作为一种规范性模型(即描述理性人应该如何决策)非常成功,但作为一种描述性模型(即描述真人如何决策)则面临诸多挑战。 * {{{阿莱悖论}}} (Allais Paradox):实验表明,人们的选择会系统性地违反独立性公理。 * {{{埃尔斯伯格悖论}}} (Ellsberg Paradox):人们倾向于规避“模糊性”(即概率未知的情况),而不仅仅是风险(概率已知),这是标准期望效用理论无法解释的。 * 为了更好地描述真实人类行为,一些替代性或扩展性理论被提出,其中最著名的是由[[丹尼尔·卡尼曼]]和[[阿摩司·特沃斯基]]提出的{{{前景理论}}} (Prospect Theory)。该理论引入了{{{参考点依赖}}}、{{{损失规避}}}和概率权重函数等概念,能更好地解释许多经验观察到的异象。