ARTICLE

牛顿-拉夫逊法

牛顿-拉夫逊法（Newton–Raphson Method）牛顿-拉夫逊法，亦称牛顿法（Newton's method）或牛顿-拉夫森法，是数值分析中最著名的求根算法之一，用于寻找实值函数公式的根。该方法由艾萨克·牛顿（Isaac Newton）在1669年前后于手稿《分析论》中提出，后由约瑟夫·拉夫逊（Joseph Raphson）在1690年独立发

浏览 4 更新 2025-10-26

牛顿-拉夫逊法（Newton–Raphson Method）

牛顿-拉夫逊法，亦称牛顿法（Newton's method）或牛顿-拉夫森法，是数值分析中最著名的求根算法之一，用于寻找实值函数 $f(x) = 0$ 的根。该方法由艾萨克·牛顿（Isaac Newton）在1669年前后于手稿《分析论》中提出，后由约瑟夫·拉夫逊（Joseph Raphson）在1690年独立发表并改进为更简洁的迭代形式，故得此名。约翰·沃利斯（John Wallis）在1685年的《代数论》中亦记载了类似方法。现代通用的迭代公式 $x_{n+1} = x_n - f(x_n)/f'(x_n)$ 则由托马斯·辛普森（Thomas Simpson）在1740年首次明确写出。牛顿-拉夫逊法以其二次收敛速度而著称——在根附近每次迭代的有效数字位数约翻一番，这使其成为求解非线性方程的首选工具。

算法原理

设 $f: \mathbb{R} \to \mathbb{R}$ 为连续可微函数，欲求 $x^*$ 使得 $f(x^*) = 0$ 。牛顿-拉夫逊法从初始猜测值 $x_0$ 出发，通过以下迭代公式更新近似解：

x_{n+1} = x_n - \frac{f(x_n)}{f'(x_n)},\quad n = 0, 1, 2, \dots

其几何直观为：在点 $(x_n, f(x_n))$ 处作函数曲线的切线，该切线与 $x$ 轴的交点即为下一次迭代点 $x_{n+1}$ 。因此该方法属于切线法（method of tangents）的范畴。从泰勒展开的角度看，将 $f(x)$ 在 $x_n$ 处一阶展开：

f(x) \approx f(x_n) + f'(x_n)(x - x_n)

令右端为零并解出 $x$ ，即得上述迭代公式。换言之，牛顿法本质上是逐次线性化策略的体现——每一步都用线性逼近替代原非线性函数。从不动点迭代的视角观察，迭代函数 $\varphi(x) = x - f(x)/f'(x)$ 在根 $x^*$ 处满足 $\varphi'(x^*) = 0$ ，这正是二次收敛的充分条件。该思想在优化、微分方程数值解和博弈论中均有广泛延伸。

收敛性分析

牛顿-拉夫逊法具有局部二次收敛性质：若 $f \in C^2$ ，且 $x^*$ 为单根（即 $f(x^*) = 0$ 且 $f'(x^*) \neq 0$ ），则存在邻域使得当初始值 $x_0$ 足够接近 $x^*$ 时，迭代序列满足

|x_{n+1} - x^*| \leq C |x_n - x^*|^2

其中常数 $C = \frac{1}{2} \max \frac{|f''(\xi)|}{|f'(\xi)|}$ 。这意味着误差以平方速度衰减，复杂度分析中每次有效迭代使精确位数翻倍。然而，该收敛性仅为局部性质——若初始值远离真根，算法可能发散（如陷入循环震荡）或收敛到其他根。经典反例为方程 $x^3 - 2x + 2 = 0$ ：在初值 $x_0 = 0$ 时，迭代在 $-1, 0, 1$ 之间来回震荡而不收敛。

对于重根（即 $f(x^*) = 0$ 且 $f'(x^*) = 0$ 的情形），牛顿法的收敛速度降为线性。此时可通过改进公式

x_{n+1} = x_n - m \cdot \frac{f(x_n)}{f'(x_n)}

恢复二次收敛，其中 $m$ 为根的重数。实际中若重数未知，可结合二分法或使用更稳定的混合算法，如Brent方法，该法综合二分法、割线法与逆二次插值的优势，保证全局收敛的同时维持较高收敛速度。

多维推广

牛顿-拉夫逊法可自然推广至多元方程组。设 $\mathbf{F}: \mathbb{R}^n \to \mathbb{R}^n$ 为向量值函数，欲求 $\mathbf{x}^*$ 满足 $\mathbf{F}(\mathbf{x}^*) = \mathbf{0}$ 。其迭代格式为：

\mathbf{x}_{n+1} = \mathbf{x}_n - [J_F(\mathbf{x}_n)]^{-1} \mathbf{F}(\mathbf{x}_n)

其中 $J_F$ 为 $\mathbf{F}$ 的雅可比矩阵（Jacobian matrix）。每一步需计算雅可比矩阵并求解线性方程组，计算代价随维数增加而快速增长。在大规模问题中，常用拟牛顿法（如BFGS算法、DFP算法及Broyden方法）以近似雅可比矩阵或海森矩阵替代精确计算，每次迭代仅需 $O(n^2)$ 而非 $O(n^3)$ 的计算量，兼顾收敛速度与计算效率。在优化领域，牛顿法是许多二阶优化算法的基础，与梯度下降法相比在条件数较差的问题上具有明显优势——梯度法沿最陡下降方向行进，但可能因曲率不同而震荡；牛顿法则通过海森矩阵提供的曲率信息进行自适应缩放，显著减少迭代次数。

数值实现注意事项

实践中应用牛顿-拉夫逊法时需注意以下关键问题：

初始值选择：初始点应尽量靠近真根。可结合二分法或网格搜索预估计合理初值。缺乏先验信息时推荐先用二分法进行粗搜索。
导数计算：解析导数不可得时，可用差商 $f'(x_n) \approx \frac{f(x_n + h) - f(x_n)}{h}$ 近似，此即割线法（secant method）的思想，但收敛速度降至超线性阶（约1.618）。
停滞与震荡：当 $f'(x_n)$ 接近零时，迭代可能发散或产生周期性震荡。应设置最大迭代次数和发散检测机制，如监测残差是否不降反升。
终止判据：通常同时采用残差准则 $|f(x_n)| < \varepsilon$ 与更新步长准则 $|x_{n+1} - x_n| < \varepsilon$ 作为停止条件，以防止误判平坦区域。
病态问题：函数在根附近高度非线性或导数变化剧烈时，需结合线搜索（line search）或阻尼策略稳定迭代。

变体与改进

针对牛顿-拉夫逊法的若干局限，学界提出了多种改进变体。阻尼牛顿法（damped Newton method）在每个步长上引入线搜索，确保充分下降以扩大收敛域。非精确牛顿法（inexact Newton method）适用于大规模稀疏问题，通过迭代法（如共轭梯度法）近似求解牛顿方程，而非直接求逆。离散牛顿法使用差分近似代替解析雅可比矩阵，适用于函数本身由复杂数值程序定义的情形。全局化牛顿法则通过同伦延拓（homotopy continuation）或信赖域方法实现全局收敛。此外，针对复数域函数的牛顿分形（Newton fractal）展示了初始值选择对收敛行为的影响，是复动力系统研究的经典主题。

应用与局限性

牛顿-拉夫逊法在科学计算与工程领域应用极广。经济学中用于求解一般均衡模型（如CGE模型）与DSGE模型的稳态方程；金融工程中用于计算隐含波动率（Black-Scholes模型的反向求解）；统计学中用于极大似然估计的数值求解（结合Fisher评分算法，即Fisher scoring）；机器学习中作为二阶优化方法（如Newton法在逻辑回归中的应用）的理论基础；电力系统中用于潮流计算（power flow analysis）；机器人学中用于逆运动学求解。

该方法的主要局限在于：局部收敛性要求初值良好；对不可微函数不适用；每次迭代需计算一阶导数（或雅可比矩阵），高维问题时计算成本高昂；对奇异雅可比矩阵敏感，且无法保证全局收敛。尽管如此，由于其二次收敛速度带来的高效率，牛顿-拉夫逊法仍是数值求根与优化领域最重要的基准算法之一。在计算机代数系统和科学计算库（如SciPy的optimize模块、MATLAB的fsolve、Julia的NLsolve包）中，牛顿-拉夫逊法及其变体均为核心求解器的基础。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。