ARTICLE

二元二次型表达方式

二元二次型 (Binary Quadratic Form) 二元二次型是数学中,特别是线性代数、数论和解析几何领域的一个核心概念。它是指关于两个变量的二次齐次多项式。理解二元二次型对于研究曲面的性质、寻找极值问题以及整数论中的表示问题具有重要意义。通常,二元二次型的表达方式主要分为两种:代数多项式表达方式和矩阵表达方式。 代数多项式表达方式 这是二元二次型最

浏览 0 更新 2025-12-09

二元二次型 (Binary Quadratic Form)

二元二次型是数学中,特别是线性代数数论解析几何领域的一个核心概念。它是指关于两个变量的二次齐次多项式。理解二元二次型对于研究曲面的性质、寻找极值问题以及整数论中的表示问题具有重要意义。通常,二元二次型的表达方式主要分为两种:代数多项式表达方式和矩阵表达方式。

代数多项式表达方式

这是二元二次型最直观的定义形式。设有两个变量xxyy,系数为aabbcc,且系数通常取自实数域R\mathbb{R}有理数域Q\mathbb{Q}(在数论中常取自整数环Z\mathbb{Z})。一个二元二次型f(x,y)f(x, y)可以表示为:

f(x,y)=ax2+bxy+cy2f(x, y) = ax^2 + bxy + cy^2

或者,为了后续矩阵处理的方便,有时也写作f(x,y)=ax2+2bxy+cy2f(x, y) = ax^2 + 2bxy + cy^2。在这种表达方式中,ax2ax^2cy2cy^2被称为平方项,bxybxy(或2bxy2bxy)被称为交叉项或混合项。如果b=0b=0,则该二次型被称为对角型或标准型,因为它不包含交叉项。这种形式直接展示了变量之间的二次关系,常用于配方法的操作中,以判定二次型的正负惯性指数。

矩阵表达方式

线性代数中,利用矩阵语言来描述二次型更为通用且威力巨大,因为它允许利用特征值特征向量等工具进行分析。对于二元二次型f(x,y)=ax2+bxy+cy2f(x, y) = ax^2 + bxy + cy^2,我们可以将其写成对称矩阵与向量乘积的形式。令向量x=(xy)\mathbf{x} = \begin{pmatrix} x \\ y \end{pmatrix},则二元二次型可以表示为:

f(x,y)=xTAx=(xy)(ab2b2c)(xy)f(x, y) = \mathbf{x}^T A \mathbf{x} = \begin{pmatrix} x & y \end{pmatrix} \begin{pmatrix} a & \frac{b}{2} \\ \frac{b}{2} & c \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix}

其中矩阵AA称为该二次型的矩阵。关键之处在于:矩阵AA必须构造为对称矩阵(AT=AA^T = A)。虽然非对称矩阵也可以生成相同的多项式结果,但在二次型理论中,我们要保证矩阵是对称的,以便应用谱定理。因此,交叉项系数bb被平均分配到了矩阵的副对角线上。在对称矩阵的约束下,二次型与矩阵是一一对应的。

如果代数形式写作ax2+2bxy+cy2ax^2 + 2bxy + cy^2,则对应的矩阵更为简洁(避免了分数),常用于数论讨论:

A=(abbc)A' = \begin{pmatrix} a & b \\ b & c \end{pmatrix}

此时f(x,y)=xTAxf(x, y) = \mathbf{x}^T A' \mathbf{x}

判别式与性质分类

通过矩阵表达方式,我们可以利用矩阵AA行列式来定义二元二次型的判别式。对于f(x,y)=ax2+bxy+cy2f(x, y) = ax^2 + bxy + cy^2,其对应矩阵AA的行列式为det(A)=ac(b2)2=acb24\det(A) = ac - (\frac{b}{2})^2 = ac - \frac{b^2}{4}。在数论和经典代数惯例中,通常定义判别式Δ\DeltaΔ=b24ac=4det(A)\Delta = b^2 - 4ac = -4 \det(A)

根据判别式的符号以及系数aa的符号,我们可以将二元二次型(在实数域上)进行分类,这通过几何上的圆锥曲线可以直观理解,同时也对应于优化理论中的定性:

正定(Positive Definite)。条件为Δ<0\Delta < 0a>0a > 0(等价于det(A)>0\det(A) > 0a>0a > 0)。性质为对于所有(x,y)(0,0)(x, y) \neq (0, 0),都有f(x,y)>0f(x, y) > 0。几何形状对应由原点出发向上的椭圆抛物面

负定(Negative Definite)。条件为Δ<0\Delta < 0a<0a < 0。性质为对于所有(x,y)(0,0)(x, y) \neq (0, 0),都有f(x,y)<0f(x, y) < 0。几何形状对应由原点出发向下的椭圆抛物面。

不定(Indefinite)。条件为Δ>0\Delta > 0(等价于det(A)<0\det(A) < 0)。性质为f(x,y)f(x, y)既可以取正值也可以取负值。几何形状对应双曲抛物面(马鞍面)。

半正定或半负定(Semi-definite)。条件为Δ=0\Delta = 0(即det(A)=0\det(A) = 0)。性质为二次型退化,存在非零点使得f(x,y)=0f(x, y) = 0。对应抛物柱面。

化标准型

学习二元二次型表达方式的一个重要目的,是学会如何将其简化为不含交叉项的形式,即标准型:f(x,y)λ1u2+λ2v2f(x, y) \to \lambda_1 u^2 + \lambda_2 v^2。实现这种变换主要有两种途径。

配方法(Lagrange's Method of Completing the Square)。这是纯代数的方法。通过可逆的线性变换,将变量重组。例如,若a0a \neq 0

f(x,y)=a(x+b2ay)2+(cb24a)y2f(x, y) = a(x + \frac{b}{2a}y)^2 + (c - \frac{b^2}{4a})y^2

u=x+b2ayu = x + \frac{b}{2a}yv=yv = y,即可消去交叉项。这种变换保持了二次型的惯性指数(正负系数的个数),但不一定保持特征值。

正交变换法(Orthogonal Transformation)。这是基于矩阵的方法。利用实对称矩阵必定可以对角化的性质,寻找矩阵AA的特征值λ1\lambda_1λ2\lambda_2和对应的单位正交特征向量。存在正交矩阵PP(即PT=P1P^T = P^{-1}),使得PTAP=Λ=diag(λ1,λ2)P^T A P = \Lambda = \text{diag}(\lambda_1, \lambda_2)。令x=Py\mathbf{x} = P \mathbf{y},则:

f(x,y)=xTAx=(Py)TA(Py)=yT(PTAP)y=λ1y12+λ2y22f(x, y) = \mathbf{x}^T A \mathbf{x} = (P \mathbf{y})^T A (P \mathbf{y}) = \mathbf{y}^T (P^T A P) \mathbf{y} = \lambda_1 y_1^2 + \lambda_2 y_2^2

此方法的几何意义是坐标轴的旋转,使得新坐标轴与二次曲面的主轴方向一致。

总结

二元二次型的表达方式是连接初等代数与高等数学的桥梁。代数表达ax2+bxy+cy2ax^2+bxy+cy^2便于进行具体的计算和配方操作。矩阵表达xTAx\mathbf{x}^T A \mathbf{x}提供了结构化的视角,便于利用行列式、迹和特征值来分析二次型的整体性质。在后续的学习中,这一概念将推广到nn二次型,但二元情况下的判别式和几何直观始终是理解高维情况的基石。