ARTICLE

绝对值函数

绝对值函数 (Absolute Value Function) 绝对值函数是数学中最基本的非光滑函数之一,定义为 f(x) = |x|,其中: x, \& x 0 \\ -x, \& x < 0 从几何角度看,|x| 表示实数 x 在数轴上到原点的距离。该函数在 x = 0 处存在尖点 (kink),这是其不可微性的来源。绝对值函数是分段线性的:在 (- ,

浏览 6 更新 2025-11-06

绝对值函数 (Absolute Value Function)

绝对值函数是数学中最基本的非光滑函数之一,定义为 f(x)=xf(x) = |x|,其中:

|x| = \begin{cases}

x, \& x \geq 0 \\ -x, \& x < 0

\end{cases}

从几何角度看,x|x| 表示实数 xx 在数轴上到原点的距离。该函数在 x=0x = 0 处存在尖点 (kink),这是其不可微性的来源。绝对值函数是分段线性的:在 (,0](-\infty, 0] 上斜率为 1-1,在 [0,+)[0, +\infty) 上斜率为 +1+1

基本性质

x,yRx, y \in \mathbb{R},绝对值函数满足以下核心性质:

  • 非负性x0|x| \geq 0,且 x=0    x=0|x| = 0 \iff x = 0
  • 正齐次性λR, λx=λx\forall \lambda \in \mathbb{R},\ |\lambda x| = |\lambda| \cdot |x|。绝对值函数是一次齐次函数的典型示例。
  • 三角不等式x+yx+y|x + y| \leq |x| + |y|。这是赋范空间中最基本的几何约束,广泛应用于不等式估计。
  • 反向三角不等式xyxy\big||x| - |y|\big| \leq |x - y|。该性质在分析误差界限时尤其有用。
  • 乘法性xy=xy|xy| = |x| \cdot |y|
  • 次可加性:三角不等式即次可加性的具体表现形式,这使绝对值成为半范数的原型。

不可微性与次微分

绝对值函数在 x=0x = 0 处不可微,但其次微分 (subdifferential) 存在:

xx=0=[1,1]\partial |x| \big|_{x=0} = [-1, 1]

即在零点处,任意介于 1-111 之间的值都可充当"广义导数"。对于 x0x \neq 0,次微分退化为单点集 x={sgn(x)}\partial |x| = \{\mathrm{sgn}(x)\},其中 sgn(x)\mathrm{sgn}(x) 为符号函数。这一不可微性在经济学优化问题中至关重要,因为很多经济模型会产生角点解。

经济学中的应用

交易成本与调整成本:在投资理论中,调整成本函数常被建模为 C(I)=aI+bI2C(I) = a|I| + bI^2,其中绝对值项 aIa|I| 捕捉了正负投资调整的不对称性——安装新资本与处置旧资本均产生不可逆成本。这种非光滑性会使得企业在面临小规模冲击时选择维持现有资本存量不变,形成无行动区间

税收与罚款函数税收罚款通常基于偏离基准的绝对值来设计。例如,T(x)=txxˉT(x) = t \cdot |x - \bar{x}| 表示对偏离目标值 xˉ\bar{x} 的行为课税。因为绝对值函数关于目标值对称增长,使得正负偏离被等量惩罚,这常见于碳税或排放权偏离处罚机制。

风险度量:在投资组合理论中,平均绝对偏差 (Mean Absolute Deviation, MAD) 定义为 MAD=E[RE[R]]\mathrm{MAD} = \mathbb{E}\big[|R - \mathbb{E}[R]|\big],是方差的替代风险度量。相比于方差,MAD 对异常值敏感度较低(线性惩罚而非二次惩罚),且作为一次齐次风险度量具有更好的统计稳健性。此外,MAD 的最小化等价于线性规划问题,相比二次规划有计算优势。

计量经济学中的 LASSO:在高维计量经济学中,LASSO (Least Absolute Shrinkage and Selection Operator) 估计量极小化目标函数:

β^LASSO=argminβ{yXβ22+λj=1pβj}\hat{\beta}_{\mathrm{LASSO}} = \arg\min_{\beta} \left\{ \|y - X\beta\|_2^2 + \lambda \sum_{j=1}^{p} |\beta_j| \right\}

惩罚项 λβj\lambda \sum |\beta_j| 是系数绝对值的加权和。绝对值在零点的不可微性导致部分系数被精确压缩至零,从而同时实现估计与变量选择。这是绝对值函数的次微分性质在统计学习中最深刻的应用之一。

消费者理论中的补偿性需求:在希克斯需求理论中,若偏好是里昂惕夫型(完全互补品),支出函数呈 e(p,u)=uajpje(p,u) = u\sum |a_j p_j| 的形式,绝对值的出现源于价格必须保持非负的结构约束与完全互补条件下不可替代性的相互作用。

讨价还价与纳什解:在讨价还价理论中,纳什讨价还价解的等价表征之一是极小化双方效用的加权绝对值差 u1d1αu2d21α|u_1 - d_1|^\alpha |u_2 - d_2|^{1-\alpha} 的形式,绝对值的不可微性反映了讨价还价前沿的边界约束。

多维推广

在多维情形,绝对值函数推广为向量的范数。其中 1\ell_1 范数定义为 x1=i=1nxi\|x\|_1 = \sum_{i=1}^{n} |x_i|,继承了绝对值的一次齐次性、三角不等式和零点不可微性。1\ell_1 范数在压缩感知稀疏回归机器学习的正则化中具有广泛应用。与此对比,欧几里得范数 x2\|x\|_2 在零点可微,这是 LASSO (1\ell_1) 与岭回归 (2\ell_2) 产生根本不同行为(稀疏性 vs 收缩但不为零)的几何根源。

常见变体与计算注意事项

  • 平滑近似:在需要可微性的数值优化中,绝对值函数常用平滑函数逼近,如 xx2+ε|x| \approx \sqrt{x^2 + \varepsilon}(其中 ε>0\varepsilon > 0 为小常数)或 Huber损失函数,后者在 xδ|x| \leq \delta 区间内用二次函数替代绝对值。
  • 极坐标表示x=max{x,x}=x2|x| = \max\{x, -x\} = \sqrt{x^2},后者在任意 xx 处光滑,但数值上可能因平方舍入误差导致不精确。
  • 符号关系xsgn(x)=xx \cdot \mathrm{sgn}(x) = |x|,且 dxdx=sgn(x)\frac{d|x|}{dx} = \mathrm{sgn}(x)x0x \neq 0 成立。