ARTICLE

平方和

平方和(英语:sum of squares)是数学与统计学中一个基本而重要的概念,指一组数值平方后的总和。它在代数、数论、几何、回归分析、方差分析等多个领域中均有广泛应用,其具体定义与统计意义因语境不同而有所差异,但始终围绕同一个核心运算——平方后的加总。 数学中的平方和 在基础代数层面,平方和即对 个实数 计算 。这一简单的运算形式构成了勾股定理的核心表达

浏览 0 更新 2025-10-26

平方和(英语:sum of squares)是数学与统计学中一个基本而重要的概念,指一组数值平方后的总和。它在代数、数论、几何、回归分析、方差分析等多个领域中均有广泛应用,其具体定义与统计意义因语境不同而有所差异,但始终围绕同一个核心运算——平方后的加总。

数学中的平方和

在基础代数层面,平方和即对

nn

个实数

x1,x2,,xnx_1, x_2, \ldots, x_n

计算

i=1nxi2=x12+x22++xn2\sum_{i=1}^{n} x_i^2 = x_1^2 + x_2^2 + \cdots + x_n^2

。这一简单的运算形式构成了勾股定理的核心表达——直角三角形斜边平方等于两直角边平方和(

a2+b2=c2a^2 + b^2 = c^2

),而这一定理是整个欧氏几何的基石之一,广泛应用于建筑、航海、测绘和物理学中。在代数恒等式方面,著名的拉格朗日恒等式将两个平方和的乘积与另一组平方和联系起来:

(a2+b2)(c2+d2)=(acbd)2+(ad+bc)2(a^2 + b^2)(c^2 + d^2) = (ac - bd)^2 + (ad + bc)^2

,这一恒等式在复数的模长运算中具有天然解释。

在数论领域,平方和问题有着悠久而辉煌的历史。古希腊数学家丢番图最早系统研究过将一个数表示为两个平方和的问题。到了17世纪,皮埃尔·德·费马提出了著名的费马平方和定理(又称费马两平方和定理):一个奇素数

pp

可以表示为两个整数的平方和(

p=a2+b2p = a^2 + b^2

)当且仅当

p1(mod4)p \equiv 1 \pmod 4

。例如

5=12+225 = 1^2 + 2^2

13=22+3213 = 2^2 + 3^2

,而

73(mod4)7 \equiv 3 \pmod 4

则无法表示。欧拉后来给出了该定理的严格证明。更进一步,拉格朗日四平方和定理指出任何自然数均可表示为至多四个整数的平方和,即

n=a2+b2+c2+d2n = a^2 + b^2 + c^2 + d^2

。这些定理不仅具有纯数学的美感,在现代密码学和编码理论中也有重要应用。

统计学中的平方和

在统计学中,平方和是最核心的运算工具之一。总平方和(Total Sum of Squares, SST)定义为每个观测值与总体均值之差的平方和,即 SST\text{SST} = i=1n\sum_{i=1}^{n} (yiy_i - yˉ\bar{y})^2,它刻画了数据集总体变异程度的大小。总平方和越大,说明数据越分散;总平方和越小,说明数据越集中。当所有观测值相等时,总平方和为零。

在回归分析中,平方和扮演着不可替代的角色。总平方和可被分解为回归平方和(Sum of Squares due to Regression, SSR)与残差平方和(Sum of Squares due to Error, SSE),即 SST\text{SST} = SSR\text{SSR} + SSE\text{SSE}。回归平方和衡量了回归模型能够解释的那部分变异,残差平方和则衡量了模型无法解释的随机误差。这一分解直接导出了决定系数

R2=SSR/SSTR^2 = \text{SSR} / \text{SST}

,用以评价回归模型的拟合优度——

R2R^2

越接近1,说明模型对数据的解释能力越强。残差平方和还是最小二乘法的优化目标,通过最小化

i=1n(yiy^i)2\sum_{i=1}^{n} (y_i - \hat{y}_i)^2

来求解回归系数,卡尔·弗里德里希·高斯在19世纪初便奠定了这一方法的数学基础。

方差分析(ANOVA)同样以平方和为核心构建。通过将总平方和分解为组间平方和(Sum of Squares Between Groups, SSB)与组内平方和(Sum of Squares Within Groups, SSW),可以构造F统计量

F=SSB/(k1)SSW/(nk)F = \frac{\text{SSB} / (k-1)}{\text{SSW} / (n-k)}

,用于检验多个组别的均值是否存在显著差异。这一方法由罗纳德·费希尔爵士在20世纪20年代系统建立,如今已是农业实验、临床试验、心理统计和质量控制等领域标准的数据分析工具。ANOVA表中"平方和"一列是计算均方、F值和p值的出发点,其重要性不言而喻。

在非参数统计中,平方和概念也有变形应用,例如弗里德曼检验和克鲁斯卡尔-沃利斯检验均基于秩次平方和构造统计量。在多元统计中,威尔克斯统计量涉及组内离差平方和矩阵与总离差平方和矩阵的行列式之比,是多元方差分析(MANOVA)的核心。

在机器学习与相关领域中的应用

在机器学习领域,平方和对应着均方误差(MSE)的未平均形式。在回归任务中,常用平方损失函数 L\mathcal{L} = i=1m\sum_{i=1}^{m} (yiy_i - y^i\hat{y}_i)^2 来衡量模型预测值与真实值之间的偏差。最小二乘法正是通过最小化残差平方和来求解模型参数,该方法的解析解 β^\hat{\beta} = (X^TX)^{-1}X^Ty 在具有闭式解的情况下保证了计算效率。支持向量机(SVM)中的软间隔优化也涉及平方和形式的正则化项。

在物理学中,平方和概念同样无处不在。转动惯量

I=miri2I = \sum m_i r_i^2

,即各质点的质量与到转轴距离平方的乘积之和,是描述刚体转动惯性的关键物理量。在信号处理中,信号的能量通常定义为各采样点幅度的平方和。在电气工程中,交流电的有效值(RMS)定义为瞬时值平方平均后的平方根,其中平方平均即涉及平方和除以周期后的平均值。

平方和的几何意义

从几何角度看,平方和最自然地对应于欧氏空间中的距离度量。向量 x\boldsymbol{x} = (x1x_1, x2x_2, \ldots, xnx_n) 各分量平方和即为该向量到原点的欧氏距离平方,即 ||x\boldsymbol{x}||^2 = i=1n\sum_{i=1}^n xix_i^2。在 PCA(主成分分析)中,样本点在各主成分方向上的投影平方和反映了该主成分解释的方差大小,平方和的排序决定了主成分的重要性次序。

平方和的概念看似简单,却贯穿了从古希腊的勾股定理到现代数据科学的整个科学史。它从代数中的基本运算出发,在数论中催生了费马平方和定理、拉格朗日四平方和定理等深刻的数论成果,在统计和机器学习中成为模型评价与推断的基石,在物理和工程中用于描述系统能量与运动状态。在实际应用中,平方和的计算极为便捷——得益于现代计算机的矩阵运算能力,大规模数据集上的平方和可在毫秒级内完成。无论从理论深度还是应用广度来看,平方和都堪称数学中最为重要且最具生命力的基本运算之一。