ARTICLE

Jensen 不等式

琴生不等式 (Jensen's Inequality) 琴生不等式(Jensen's Inequality)是不等式分析和概率论中最基本也最重要的结果之一,以丹麦数学家 Johan Jensen 命名。它刻画了凸函数(或凹函数)作用于期望值时的数量关系:对于凸函数,函数的期望大于等于期望的函数值;对于凹函数,关系恰好反向。该不等式在微观经济学、金融经济学和信

浏览 0 更新 2025-10-27

琴生不等式 (Jensen's Inequality)

琴生不等式(Jensen's Inequality)是不等式分析和概率论中最基本也最重要的结果之一,以丹麦数学家 Johan Jensen 命名。它刻画了凸函数(或凹函数)作用于期望值时的数量关系:对于凸函数,函数的期望大于等于期望的函数值;对于凹函数,关系恰好反向。该不等式在微观经济学金融经济学信息经济学中有着广泛而深刻的应用,尤其是在风险决策理论和期权定价理论中占据核心地位。

定义与数学表述

XX 是一个随机变量,其支撑集包含于某个区间 IRI \subseteq \mathbb{R},且期望 E[X]\mathbb{E}[X] 存在且有限。设 φ:IR\varphi: I \to \mathbb{R} 是一个函数。

φ\varphi 是凸函数(即 φ(x)0\varphi''(x) \ge 0 对所有内点 xIx \in I 成立),则:

φ(E[X])E[φ(X)]\varphi(\mathbb{E}[X]) \le \mathbb{E}[\varphi(X)]

φ\varphi 是凹函数(即 φ(x)0\varphi''(x) \le 0),不等式反向:

φ(E[X])E[φ(X)]\varphi(\mathbb{E}[X]) \ge \mathbb{E}[\varphi(X)]

等号成立当且仅当:φ\varphiXX 的支撑集上是线性的,或者 XX退化随机变量(即以概率 1 取常数值)。离散情形下,若 XX 取值 x1,,xnx_1, \dots, x_nλi=1,λi0\sum \lambda_i = 1, \lambda_i \ge 0,则凸函数满足:

φ(i=1nλixi)i=1nλiφ(xi)\varphi\left(\sum_{i=1}^n \lambda_i x_i\right) \le \sum_{i=1}^n \lambda_i \varphi(x_i)

这就是 Jensen 不等式在离散概率下的经典形式,也是凸性定义的直接推广(从两点线性组合到 n 点加权平均)。

凸性的几何直觉与证明思路

Jensen 不等式的本质在于凸函数的几何性质:凸函数图像上任意两点间的连线位于函数图像之上——即"函数值不大于线性插值"。推广到期望(即无穷凸组合),结论保持不变。

证明的关键步骤依赖于支撑超平面(Supporting Hyperplane)的存在性:对于可微凸函数 φ\varphi,在任意点 x0Ix_0 \in I 处有:

φ(x)φ(x0)+φ(x0)(xx0),xI\varphi(x) \ge \varphi(x_0) + \varphi'(x_0)(x - x_0), \quad \forall x \in I

即函数图像始终位于其任意一点的切线之上。取 x0=E[X]x_0 = \mathbb{E}[X],将 x=Xx = X 代入上式并两边取期望:

E[φ(X)]E[φ(E[X])+φ(E[X])(XE[X])]=φ(E[X])+φ(E[X])E[XE[X]]=φ(E[X])\mathbb{E}[\varphi(X)] \ge \mathbb{E}\left[\varphi(\mathbb{E}[X]) + \varphi'(\mathbb{E}[X])(X - \mathbb{E}[X])\right] = \varphi(\mathbb{E}[X]) + \varphi'(\mathbb{E}[X])\mathbb{E}[X - \mathbb{E}[X]] = \varphi(\mathbb{E}[X])

因为 E[XE[X]]=0\mathbb{E}[X - \mathbb{E}[X]] = 0,不等式得证。对于不可微的凸函数,可利用次梯度(subgradient)推广同样的论证。

风险规避的微观基础

Jensen 不等式是理解不确定性下经济决策的数学基石。在期望效用理论(Expected Utility Theory)中,决策者的偏好由一个冯·诺依曼-摩根斯坦效用函数 u()u(\cdot) 表示。面对一个随机财富 W~\tilde{W},决策者比较确定性等价财富 CECE(满足 u(CE)=E[u(W~)]u(CE) = \mathbb{E}[u(\tilde{W})])与期望财富 E[W~]\mathbb{E}[\tilde{W}]

uu 是严格凹函数(u<0u'' < 0),Jensen 不等式直接给出:

E[u(W~)]<u(E[W~])\mathbb{E}[u(\tilde{W})] < u(\mathbb{E}[\tilde{W}])

这意味着决策者对于任何非退化风险,其期望效用严格小于在期望财富处的效用值,等价于确定性等价严格小于期望财富:CE<E[W~]CE < \mathbb{E}[\tilde{W}]。该差距即为风险溢价(Risk Premium):

π=E[W~]CE>0\pi = \mathbb{E}[\tilde{W}] - CE > 0

风险溢价衡量了决策者愿意放弃多少期望财富以完全消除风险。绝对风险规避系数(Arrow-Pratt 测度)rA(w)=u(w)/u(w)r_A(w) = -u''(w)/u'(w) 用以度量凹度及由此产生的风险溢价大小。

金融经济学中的应用

金融经济学中,Jensen 不等式至少有三个重要应用:

1. Jensen's Alpha(詹森阿尔法)。 资本资产定价模型(CAPM)中,资产或组合的超额收益分解为系统性部分和超额部分。Jensen's Alpha 衡量经风险调整后的超额收益。此处名称来源于 Michael Jensen(1968),虽非直接源自 Jensen 不等式,但两者的数学逻辑一脉相承——Alpha 的显著性检验依赖于线性回归框架下的期望运算。

2. 期权定价下界。 欧式看涨期权在到期日的 payoff 为 max{STK,0}\max\{S_T - K, 0\},这是一个关于标的资产价格 STS_T 的凸函数。由 Jensen 不等式:

E[max{STK,0}]max{E[ST]K,0}\mathbb{E}[\max\{S_T - K, 0\}] \ge \max\{\mathbb{E}[S_T] - K, 0\}

期权价格(折现后的期望 payoff)必须不低于其"内在价值"按远期价格计算的结果。当波动率为零时等号成立;波动率越高,严格不等式产生的期权价值越高。这解释了为什么期权价格是波动率的增函数。

3. 债券定价与收益率。 零息债券价格与到期收益率之间存在非线性(凸性)关系。对于给定的收益率变动,债券价格的期望变化方向由凸性(Convexity)调整项决定,而该调整项为正,本质上是 Jensen 不等式在固定收益分析中的直接体现。

信息经济学与信号理论

信息经济学中,Jensen 不等式用于分析信息的价值。假设决策者可以选择在行动之前获取一个关于状态 θ\theta 的信号 ss。在没有信号时,决策者根据先验期望 E[θ]\mathbb{E}[\theta] 做出最优决策,获得期望 payoff π(E[θ])\pi(\mathbb{E}[\theta])。在有信号时,决策者可以根据信号 ss 的条件期望 E[θs]\mathbb{E}[\theta \mid s] 来做决策,此时事前期望 payoff 为 E[π(E[θs])]\mathbb{E}[\pi(\mathbb{E}[\theta \mid s])]

若 payoff 函数 π()\pi(\cdot) 是凸函数,Jensen 不等式意味着:

E[π(E[θs])]π(E[E[θs]])=π(E[θ])\mathbb{E}[\pi(\mathbb{E}[\theta \mid s])] \ge \pi(\mathbb{E}[\mathbb{E}[\theta \mid s]]) = \pi(\mathbb{E}[\theta])

即信息的价值非负——凸 payoff 下,信息总是有益的。反之,若 payoff 是凹函数(如典型的风险规避效用函数),信息未必提升福利,甚至可能因"信息带来的风险"而有害(Hirshleifer 效应)。

历史背景与推广

Johan Jensen 于 1906 年在 Acta Mathematica 上发表了这一定理,但其思想渊源可追溯至 Hölder 和 Minkowski 的早期工作。Jensen 不等式的离散形式本质上是凸函数定义的有限推广,而连续(积分)形式则通过测度论框架统一处理。在测度论中,若 (Ω,F,μ)(\Omega, \mathcal{F}, \mu) 是概率空间,则对于 μ\mu-可积函数 ff 和凸函数 φ\varphi

φ(Ωfdμ)Ωφfdμ\varphi\left(\int_\Omega f \, d\mu\right) \le \int_\Omega \varphi \circ f \, d\mu

该形式将离散求和与连续期望纳入统一框架。

Jensen 不等式与赫尔德不等式(Hölder's Inequality)、闵可夫斯基不等式(Minkowski's Inequality)共同构成了凸分析中三大基本不等式。事实上,赫尔德不等式和闵可夫斯基不等式均可由 Jensen 不等式配合适当的凸函数导出,体现了 Jensen 不等式在不等式体系中的基础地位。

一般均衡与福利经济学

一般均衡理论中,Jensen 不等式对理解加总行为和代表性消费者具有方法论意义。若经济体中存在异质性个体,每个个体的需求函数是非线性的,则加总需求一般不等于代表性消费者在平均收入下的需求。具体而言,若个体需求函数 x(p,m)x(p, m) 关于收入 mm 是凸函数,则由 Jensen 不等式:

E[x(p,mi)]x(p,E[mi])\mathbb{E}[x(p, m_i)] \ge x(p, \mathbb{E}[m_i])

即忽略收入分布的不平等会低估总需求。这一逻辑在分析收入分配对消费结构的影响时至关重要。

福利经济学中,社会福利函数通常设定为个体效用的凹函数(体现不平等厌恶)。若个体效用本身是收入的凹函数(边际效用递减),则给定总收入,更平等的分配带来更高的社会福利——这一结论本质上是 Jensen 不等式在社会选择领域的直接推论。

博弈论与契约理论

博弈论中,Jensen 不等式出现在混合策略的 payoff 分析中。考虑一个参与人采用混合策略,其 payoff 函数 u(s,σi)u(s, \sigma_{-i}) 关于自身策略 ss 是凸的,则:

E[u(s~,σi)]u(E[s~],σi)\mathbb{E}[u(\tilde{s}, \sigma_{-i})] \ge u(\mathbb{E}[\tilde{s}], \sigma_{-i})

这意味着纯化混合策略总能(弱)提升期望收益,从而解释了为什么具有凸 payoff 的博弈(如某些拍卖和竞赛)中纯策略更受偏好。这一观察在委托代理理论中同样重要:当代理人的工资是业绩的非线性函数时,Jensen 不等式决定了激励相容约束的具体形态。

计量经济学中的应用

计量经济学中,Jensen 不等式在处理非线性变换后的变量时扮演关键角色。若模型中对被解释变量做了对数变换(lnY=Xβ+ε\ln Y = X\beta + \varepsilon),预测 E[YX]\mathbb{E}[Y \mid X] 时不能简单地取 exp(Xβ^)\exp(X\hat{\beta}),因为:

E[YX]=E[exp(Xβ+ε)X]\mathbb{E}[Y \mid X] = \mathbb{E}[\exp(X\beta + \varepsilon) \mid X]

εXN(0,σ2)\varepsilon \mid X \sim N(0, \sigma^2),则由对数正态分布性质:

E[YX]=exp(Xβ+σ2/2)>exp(Xβ)\mathbb{E}[Y \mid X] = \exp(X\beta + \sigma^2/2) > \exp(X\beta)

这里 Jensen 不等式决定了 naive 反变换(exp(Xβ^)\exp(X\hat{\beta}))会系统性低估 YY 的条件期望——需要加上 σ2/2\sigma^2/2污迹校正(Smearing Retransformation)。

Jensen 不等式虽然形式简洁,但其涵盖的范围从纯粹的概率论一直延伸到经济决策、资产定价、信息价值和计量方法等各个领域。正是这种简洁性与普遍性的统一,使其成为经济学数学工具中最不可或缺的基石之一。