决策规则 (Decision Rule)
决策规则 (Decision Rule) 是统计推断和决策理论中的核心概念,它是一个从样本空间到行动空间(或决策空间)的映射函数,规定了在面对观测数据时应采取何种行动或做出何种判断。简单来说,决策规则回答了这样一个问题:"给定我们看到的证据,我们应该怎么做?"
决策规则的形式化定义为:
设 X 为样本空间,即所有可能观测到的数据 x 的集合;设 A 为行动空间,即所有可能采取的行动 a 的集合。一个(非随机化的)决策规则 d 是一个函数:
d:X→A,d(x)=a
换言之,决策规则 d(⋅) 事先为每一个可能的样本结果 x 指定了对应的行动 a。
决策规则的基本要素
理解决策规则需要先把握统计决策理论的基本框架,它由以下几个要素构成:
参数空间与样本空间
设 θ∈Θ 是未知的真实参数,属于参数空间 Θ。我们观测到的数据 X 服从某个依赖于 θ 的分布 Pθ。决策的目标是基于 X 的观测值 x,对 θ 做出某种推断或行动。
行动空间
行动空间 A 的具体形式取决于问题的性质:
- 在假设检验中,A={0,1},其中 0 表示"不拒绝零假设 H0",1 表示"拒绝 H0"。
- 在参数估计中,A=Θ,即行动就是给出参数的一个估计值。
- 在更一般的决策问题中,行动空间可以是任何抽象集合。
损失函数
损失函数 (Loss Function) L(θ,a) 度量了当真参数为 θ 时采取行动 a 所带来的损失。它是连接统计推断与现实后果的桥梁。常见的损失函数包括:
- 平方损失 (Squared Error Loss):L(θ,a)=(θ−a)2,广泛用于估计问题。
- 0-1损失 (0-1 Loss):在假设检验中,正确决策损失为0,错误决策损失为1。
- 绝对损失 (Absolute Loss):L(θ,a)=∣θ−a∣。
风险函数
给定决策规则 d,其表现的优劣通过风险函数 (Risk Function) 来衡量。风险函数定义为损失函数的期望值:
R(θ,d)=Eθ[L(θ,d(X))]=∫XL(θ,d(x))f(x∣θ)dx
其中 f(x∣θ) 是样本的概率密度函数(或概率质量函数)。风险函数 R(θ,d) 给出了当真参数为 θ 时,反复使用决策规则 d 所带来的平均损失。一个好的决策规则应该使风险函数在某种意义下"小"。
决策规则的比较与选择准则
由于风险函数 R(θ,d) 是 θ 的函数,两个不同的决策规则 d1 和 d2 可能在某些 θ 值下 d1 表现更好,而在另一些 θ 值下 d2 表现更好。这就引出了比较决策规则的不同准则。
可容许性 (Admissibility)
一个决策规则 d 被称为不可容许的 (Inadmissible),如果存在另一个决策规则 d′ 使得:
R(θ,d′)≤R(θ,d)对所有 θ∈Θ
且至少存在一个 θ0 使得严格不等式成立:
R(θ0,d′)<R(θ0,d)
换言之,d′ 在所有参数值下都不比 d 差,且至少在某一点上严格优于 d,那么 d 就是不可容许的。如果一个决策规则不是不可容许的,则称其为可容许的 (Admissible)。可容许性是决策规则的一个最低要求——使用一个不可容许的规则意味着我们可以在不付出任何代价的情况下找到一个更好的替代。
一个经典的结果是:在平方损失下,对于正态均值的估计,样本均值 Xˉ 在一维情况下是可容许的,但在 p≥3 维时是不可容许的——这就是著名的 Stein现象,James-Stein估计量在均方误差意义上一致优于多维样本均值。
极小化极大准则 (Minimax)
极小化极大准则采取的是"最坏情况分析"的视角。它试图在最不利的参数值下最小化风险:
d∗=argdminθ∈ΘmaxR(θ,d)
一个极小化极大决策规则 d∗ 满足:
θmaxR(θ,d∗)=dinfθmaxR(θ,d)
极小化极大准则是一种保守策略——它不要求任何关于 θ 的先验信息,只关注最坏情况。这种方法在博弈论和稳健统计中特别重要。
贝叶斯决策规则 (Bayes Rule)
在贝叶斯框架中,我们假设未知参数 θ 本身也是一个随机变量,具有先验分布 π(θ)。贝叶斯决策规则是最小化后验期望损失(即贝叶斯风险)的规则:
r(π,d)=∫ΘR(θ,d)π(θ)dθ=∫Θ∫XL(θ,d(x))f(x∣θ)π(θ)dxdθ
贝叶斯决策规则 dπ 满足对每个 x,选择使后验期望损失最小的行动:
dπ(x)=arga∈Amin∫ΘL(θ,a)π(θ∣x)dθ
其中 π(θ∣x) 是在观测到 x 后关于 θ 的后验分布。在先验分布合理且损失函数恰当的情况下,贝叶斯规则通常具有良好的统计性质。此外,所有贝叶斯规则(在适当条件下)都是可容许的,这一性质被称为"贝叶斯规则的可容许性定理"。
假设检验中的决策规则
在Neyman-Pearson引理框架下,假设检验的决策规则体现为检验函数 ϕ(x):
ϕ(x)={10拒绝 H0不拒绝 H0
该决策规则的拒绝域为 {x:ϕ(x)=1}。Neyman-Pearson 引理指出,对于简单假设 H0:θ=θ0 对 H1:θ=θ1,在给定显著性水平 α(即限定I型错误概率)的约束下,基于似然比的决策规则是最优的:
ϕ(x)=⎩⎨⎧10若 f(x∣θ0)f(x∣θ1)>k若 f(x∣θ0)f(x∣θ1)<k
这里的阈值 k 由显著性水平 α 决定。该决策规则在所有满足水平 α 的检验中,最大化了对 θ1 的检验功效(即II型错误概率最小)。
随机化决策规则
有时,非随机化的决策规则(即对每个 x 确定性地选择一个行动)不足以达到最优。例如,在离散分布的假设检验中欲精确达到某个显著性水平 α,就需要引入随机化决策规则 (Randomized Decision Rule)。
一个随机化决策规则 δ(⋅∣x) 对每个 x 指定 A 上的一个概率分布。δ(a∣x) 表示在观测到 x 时选择行动 a 的概率。其风险函数为:
R(θ,δ)=∫X∫AL(θ,a)δ(da∣x)f(x∣θ)dx
随机化决策规则在理论分析中很重要(特别是在证明极小化极大定理时),但在实际应用中,通常只有在离散分布的情形下才需要使用随机化。
决策规则与经济学
决策规则的概念远超纯统计学范畴,在经济学特别是信息经济学、博弈论和机制设计中也有广泛应用。例如:
- 在委托-代理模型中,委托人设计的契约本质上就是一个决策规则——它规定了在不同可观测结果下代理人的报酬。
- 在贝叶斯博弈中,每个参与者的策略是一个从其类型空间(样本空间)到其行动空间的函数,这恰好是决策规则的结构。
- 在统计歧视理论中,雇主基于求职者的群体特征(如学历、种族)做出雇佣决策,这背后隐含的就是一个决策规则。
理解决策规则的形式结构,有助于在更广泛的语境中把握"从信息到行动"这一逻辑链条的本质。无论是统计学家选择假设检验的方法,还是政策制定者根据经济指标决定是否调整利率,他们都面临同样的核心问题:给定不确定性下的观测信息,如何做出最优决策。