ARTICLE

权重函数

权重函数 定义与基本概念 权重函数(weight function / weighting function)是数学、统计学和经济学中广泛使用的工具,其核心思想是对不同观测值、变量或结果赋予不同的权重,以反映其相对重要性或调整系统偏差。形式化地,权重函数 w: X → ℝ⁺ 将定义域中的每个元素 x 映射为一个非负实数权重 w(x)。权重函数既可以是离散的(

浏览 0 更新 2025-07-17

权重函数

定义与基本概念

权重函数(weight function / weighting function)是数学、统计学和经济学中广泛使用的工具,其核心思想是对不同观测值、变量或结果赋予不同的权重,以反映其相对重要性或调整系统偏差。形式化地,权重函数 w: X → ℝ⁺ 将定义域中的每个元素 x 映射为一个非负实数权重 w(x)。权重函数既可以是离散的(为有限个点分别赋值),也可以是连续的(在某个区间上定义密度函数)。

权重函数与概率密度函数有密切联系:归一化后的权重函数可视为一种概率分布,而抽样中的权重则常被用来纠正样本与总体之间的结构性差异。在加权平均中,权重函数决定了各成分对最终结果的贡献比例,因而其选择直接影响分析结论的可靠性和准确性。例如,消费者价格指数中各类商品的权重反映其消费支出份额,若权重设置不当,指数将无法真实反映物价变动对居民的影响。

前景理论中的权重函数

在行为经济学中,Kahneman 和 Tversky 提出的前景理论(prospect theory)引入了决策权重函数 π(p)。该函数将客观概率 p 映射为决策者在评估风险时实际使用的心理权重,反映了人类决策中对概率的非线性处理特征。

决策权重函数具有以下典型特征:(1)小概率事件被高估,即对于较小的 p,有 π(p) > p,这解释了人们为何同时购买彩票(追逐小概率高收益)和保险(规避小概率大损失);(2)中高概率被低估,即对于中等及较大的 p,有 π(p) < p,说明人们倾向于低估大概率事件的确定性程度;(3)次确定效应:在确定性边界附近,概率权重出现突变,从非常不确定到完全确定之间存在质的飞跃;(4)端点性质:π(0) = 0 且 π(1) = 1,即不可能事件和必然事件的权重与客观概率一致。

Tversky 和 Kahneman(1992)提出了如下具体的权重函数形式:

π(p)=pγ(pγ+(1p)γ)1/γ\pi(p) = \frac{p^\gamma}{(p^\gamma + (1-p)^\gamma)^{1/\gamma}}

参数 γ 控制函数的曲率,当 γ = 1 时退化为线性概率处理;实证研究表明 γ 通常取值在 0.5 至 0.7 之间,表明实际决策中概率权重曲线呈倒 S 形。这一函数形式成功解释了阿莱悖论(Allais paradox)和共同比率效应等诸多违背期望效用理论的现象,为行为金融学和实验经济学奠定了理论基础。

后续研究进一步提出了两参数权重函数形式,如 Prelec(1998)提出的函数 π(p) = exp(-δ(-ln p)^α),其中 α 控制函数的曲率,δ 控制函数的升降程度。该类函数具有更好的拟合优度,能够更精确地描述决策者在不同概率区间的权重扭曲特征。

统计学中的权重函数

在统计推断中,权重函数具有多重角色。第一类是抽样权重(sampling weights),又称设计权重。在复杂抽样调查中,各单位入样概率不同,使用与入样概率成反比的权重可以构造总体参数的无偏估计。若同时结合事后分层和无应答调整,则可进一步降低估计偏差。美国当前人口调查(CPS)就采用多阶段权重调整方案,以保证样本的代表性。

第二类是核权重函数(kernel weighting function),广泛用于非参数统计方法中。在核密度估计和核回归中,核函数 K(·) 扮演权重函数的角色,决定邻域内各观测值对估计点的相对影响。常用的核函数包括高斯核、Epanechnikov 核和均匀核。核权重函数通常具有对称性、非负性和归一化性质,其带宽参数控制着估计的偏差‒方差权衡:带宽过小导致估计波动剧烈,带宽过大则过度平滑丢失细节。

第三类是加权最小二乘法(WLS)中的权重函数。当误差项存在异方差性时,使用与误差方差倒数成比例的权重可获得更有效的参数估计。这一思想可推广至广义最小二乘法(GLS),其中权重矩阵反映误差协方差的结构信息。在经济计量学中,White 稳健标准误实际上也利用了加权思想来修正异方差带来的推断偏误。

第四类为局部回归中的权重函数。Cleveland 提出的 LOESS 方法使用邻近观测值的距离递减权重进行局部多项式拟合,其中权重函数通常采用三次方核或三立方核,使得距离估计点越近的观测值贡献越大。该方法在数据驱动建模、时间序列平滑和散点图拟合中具有广泛应用。

机器学习中的权重函数

在机器学习领域,权重函数出现在多个重要算法中。AdaBoost 算法通过迭代调整训练样本的权重,使得后续分类器更关注此前被错误分类的样本,权重函数在此充当了自适应注意力分配机制。其权重更新规则为 wiw_i^{(t+1)} = wiw_i^{(t)} exp(-α\_t yiy_i hth_t(xix_i)),其中分类正确的样本权重下降,分类错误的样本权重上升。

在重要性采样(importance sampling)中,权重函数 w(x) = p(x)/q(x) 使得在分布 q 下抽样可以估计关于分布 p 的期望,这一技术是贝叶斯计算和强化学习中的核心工具。序列重要性采样和粒子滤波进一步将权重函数推广到动态系统中,通过重采样步骤避免权重退化问题。

近年来,注意力机制(attention mechanism)在深度学习中取得巨大成功,其本质也是动态权重函数:模型根据输入内容自动计算各位置的权重,实现信息的自适应筛选和聚合。自注意力机制中的缩放点积注意力公式为 Attention(Q,K,V) = softmax(QK^T/√d) V,其中 softmax 输出即为注意力权重。

其他领域的应用

在信号处理中,窗函数(window function)是一种特殊的权重函数,用于截断无限序列以减少频谱泄漏。汉明窗、汉宁窗和布莱克曼窗等各有不同的旁瓣抑制特性,选择合适的窗函数需要在主瓣宽度和旁瓣衰减之间取得平衡。

在经济学社会福利分析中,社会福利函数本质上是将不同个体的效用加总为总体福利的权重函数。罗尔斯主义赋予最弱势群体最高权重,而功利主义赋予所有个体相等权重。在收入不平等度量中,Atkinson 指数通过参数 ε 调整不同收入水平人群的权重,ε 越大表示越关注低收入群体。

在数值分析中,Gaussian 求积公式的权重函数决定了正交多项式族及其求积节点,直接影响数值积分的精度和稳定性。不同权重函数对应不同的正交多项式,如 Legendre 多项式对应权重函数 w(x)=1,Chebyshev 多项式对应 w(x)=1/√(1-x²)。

小结

权重函数作为一个跨学科的数学工具,其核心价值在于灵活表达不同元素在整体中的相对重要性。从行为决策到统计推断,从机器学习到信号处理,权重函数的具体形式因问题背景而异,但都遵循非负性这一基本约束。理解权重函数的选择原则、参数意义和诊断方法,对于正确应用各类加权方法、避免权重误设导致的结论偏差至关重要。