二元二次型 (Binary Quadratic Form)
二元二次型是数学中,特别是线性代数、数论和解析几何领域的一个核心概念。它是指关于两个变量的二次齐次多项式。理解二元二次型对于研究曲面的性质、寻找极值问题以及整数论中的表示问题具有重要意义。通常,二元二次型的表达方式主要分为两种:代数多项式表达方式和矩阵表达方式。
代数多项式表达方式
这是二元二次型最直观的定义形式。设有两个变量x和y,系数为a、b、c,且系数通常取自实数域R或有理数域Q(在数论中常取自整数环Z)。一个二元二次型f(x,y)可以表示为:
f(x,y)=ax2+bxy+cy2
或者,为了后续矩阵处理的方便,有时也写作f(x,y)=ax2+2bxy+cy2。在这种表达方式中,ax2和cy2被称为平方项,bxy(或2bxy)被称为交叉项或混合项。如果b=0,则该二次型被称为对角型或标准型,因为它不包含交叉项。这种形式直接展示了变量之间的二次关系,常用于配方法的操作中,以判定二次型的正负惯性指数。
矩阵表达方式
在线性代数中,利用矩阵语言来描述二次型更为通用且威力巨大,因为它允许利用特征值和特征向量等工具进行分析。对于二元二次型f(x,y)=ax2+bxy+cy2,我们可以将其写成对称矩阵与向量乘积的形式。令向量x=(xy),则二元二次型可以表示为:
f(x,y)=xTAx=(xy)(a2b2bc)(xy)
其中矩阵A称为该二次型的矩阵。关键之处在于:矩阵A必须构造为对称矩阵(AT=A)。虽然非对称矩阵也可以生成相同的多项式结果,但在二次型理论中,我们要保证矩阵是对称的,以便应用谱定理。因此,交叉项系数b被平均分配到了矩阵的副对角线上。在对称矩阵的约束下,二次型与矩阵是一一对应的。
如果代数形式写作ax2+2bxy+cy2,则对应的矩阵更为简洁(避免了分数),常用于数论讨论:
A′=(abbc)
此时f(x,y)=xTA′x。
判别式与性质分类
通过矩阵表达方式,我们可以利用矩阵A的行列式来定义二元二次型的判别式。对于f(x,y)=ax2+bxy+cy2,其对应矩阵A的行列式为det(A)=ac−(2b)2=ac−4b2。在数论和经典代数惯例中,通常定义判别式Δ为Δ=b2−4ac=−4det(A)。
根据判别式的符号以及系数a的符号,我们可以将二元二次型(在实数域上)进行分类,这通过几何上的圆锥曲线可以直观理解,同时也对应于优化理论中的定性:
正定(Positive Definite)。条件为Δ<0且a>0(等价于det(A)>0且a>0)。性质为对于所有(x,y)=(0,0),都有f(x,y)>0。几何形状对应由原点出发向上的椭圆抛物面。
负定(Negative Definite)。条件为Δ<0且a<0。性质为对于所有(x,y)=(0,0),都有f(x,y)<0。几何形状对应由原点出发向下的椭圆抛物面。
不定(Indefinite)。条件为Δ>0(等价于det(A)<0)。性质为f(x,y)既可以取正值也可以取负值。几何形状对应双曲抛物面(马鞍面)。
半正定或半负定(Semi-definite)。条件为Δ=0(即det(A)=0)。性质为二次型退化,存在非零点使得f(x,y)=0。对应抛物柱面。
化标准型
学习二元二次型表达方式的一个重要目的,是学会如何将其简化为不含交叉项的形式,即标准型:f(x,y)→λ1u2+λ2v2。实现这种变换主要有两种途径。
配方法(Lagrange's Method of Completing the Square)。这是纯代数的方法。通过可逆的线性变换,将变量重组。例如,若a=0:
f(x,y)=a(x+2aby)2+(c−4ab2)y2
令u=x+2aby、v=y,即可消去交叉项。这种变换保持了二次型的惯性指数(正负系数的个数),但不一定保持特征值。
正交变换法(Orthogonal Transformation)。这是基于矩阵的方法。利用实对称矩阵必定可以对角化的性质,寻找矩阵A的特征值λ1、λ2和对应的单位正交特征向量。存在正交矩阵P(即PT=P−1),使得PTAP=Λ=diag(λ1,λ2)。令x=Py,则:
f(x,y)=xTAx=(Py)TA(Py)=yT(PTAP)y=λ1y12+λ2y22
此方法的几何意义是坐标轴的旋转,使得新坐标轴与二次曲面的主轴方向一致。
总结
二元二次型的表达方式是连接初等代数与高等数学的桥梁。代数表达ax2+bxy+cy2便于进行具体的计算和配方操作。矩阵表达xTAx提供了结构化的视角,便于利用行列式、迹和特征值来分析二次型的整体性质。在后续的学习中,这一概念将推广到n元二次型,但二元情况下的判别式和几何直观始终是理解高维情况的基石。