ARTICLE

二次型

二次型 (Quadratic Form) 二次型(Quadratic Form)是线性代数与矩阵理论中的核心概念,在计量经济学、最优化理论和数理统计中具有极为广泛的应用。形式上,一个关于 n 维向量 x R^n 的二次型定义为: 其中 A 为 n n 实矩阵。不失一般性,通常假定 A 为对称矩阵,因为任意方阵均可通过 B = 12( A + A^T) 对称化

浏览 5 更新 2026-07-18

二次型 (Quadratic Form)

二次型(Quadratic Form)是线性代数与矩阵理论中的核心概念,在计量经济学最优化理论数理统计中具有极为广泛的应用。形式上,一个关于 nn 维向量 xRn\mathbf{x} \in \mathbb{R}^n 的二次型定义为:

Q(x)=xTAx=i=1nj=1naijxixjQ(\mathbf{x}) = \mathbf{x}^T \mathbf{A} \mathbf{x} = \sum_{i=1}^{n} \sum_{j=1}^{n} a_{ij} x_i x_j

其中 A\mathbf{A}n×nn \times n 实矩阵。不失一般性,通常假定 A\mathbf{A} 为对称矩阵,因为任意方阵均可通过 B=12(A+AT)\mathbf{B} = \frac{1}{2}(\mathbf{A} + \mathbf{A}^T) 对称化而不改变二次型的值,即 xTAx=xT(A+AT2)x\mathbf{x}^T \mathbf{A} \mathbf{x} = \mathbf{x}^T \left(\frac{\mathbf{A} + \mathbf{A}^T}{2}\right) \mathbf{x}。二次型是关于 x\mathbf{x} 的齐二次多项式,不含一次项或常数项,其几何意义与二次曲面、椭圆抛物面等密切相关。

定号性与特征值判定

二次型的定性(Definiteness)是其在经济学中最重要的性质之一。对于对称矩阵 A\mathbf{A},定义:

  • 正定(Positive Definite):对所有 x0\mathbf{x} \neq \mathbf{0},有 xTAx>0\mathbf{x}^T \mathbf{A} \mathbf{x} > 0。记为 A0\mathbf{A} \succ 0
  • 半正定(Positive Semidefinite):对所有 x\mathbf{x},有 xTAx0\mathbf{x}^T \mathbf{A} \mathbf{x} \geq 0。记为 A0\mathbf{A} \succeq 0
  • 负定(Negative Definite):对所有 x0\mathbf{x} \neq \mathbf{0},有 xTAx<0\mathbf{x}^T \mathbf{A} \mathbf{x} < 0。记为 A0\mathbf{A} \prec 0
  • 不定(Indefinite):存在 x1,x2\mathbf{x}_1, \mathbf{x}_2 使 x1TAx1>0\mathbf{x}_1^T \mathbf{A} \mathbf{x}_1 > 0x2TAx2<0\mathbf{x}_2^T \mathbf{A} \mathbf{x}_2 < 0

定性判定可通过两种等价方法实现:

(一)特征值法:设对称矩阵 A\mathbf{A} 的特征值为 λ1,λ2,,λn\lambda_1, \lambda_2, \dots, \lambda_n,则:

A0    λi>0,  i;A0    λi0,  i\mathbf{A} \succ 0 \iff \lambda_i > 0, \; \forall i; \qquad \mathbf{A} \succeq 0 \iff \lambda_i \geq 0, \; \forall i

类似地,A0\mathbf{A} \prec 0 当且仅当所有特征值严格为负。这是最简洁的判定方式,但计算特征值有时并不经济。

(二)顺序主子式法(Sylvester准则):记 Δk\Delta_kA\mathbf{A}kk 阶顺序主子式(即前 kkkk 列构成子矩阵的行列式),则:

A0    Δk>0,  k=1,2,,n\mathbf{A} \succ 0 \iff \Delta_k > 0, \; k = 1, 2, \dots, n

负定时,顺序主子式需满足符号交替条件:(1)kΔk>0(-1)^k \Delta_k > 0。此方法在海塞矩阵的极值判定中尤为常用。

二次型的谱分解与几何意义

对称矩阵 A\mathbf{A} 可正交对角化:A=PΛPT\mathbf{A} = \mathbf{P} \mathbf{\Lambda} \mathbf{P}^T,其中 P\mathbf{P} 为正交矩阵,Λ=diag(λ1,,λn)\mathbf{\Lambda} = \operatorname{diag}(\lambda_1, \dots, \lambda_n)。代入二次型得:

Q(x)=xTPΛPTx=yTΛy=i=1nλiyi2,y=PTxQ(\mathbf{x}) = \mathbf{x}^T \mathbf{P} \mathbf{\Lambda} \mathbf{P}^T \mathbf{x} = \mathbf{y}^T \mathbf{\Lambda} \mathbf{y} = \sum_{i=1}^{n} \lambda_i y_i^2, \qquad \mathbf{y} = \mathbf{P}^T \mathbf{x}

这意味着任何二次型均可通过正交变换化为标准型(对角形),仅含平方项而无交叉项。在几何上,当 A0\mathbf{A} \succ 0 时,xTAx=c\mathbf{x}^T \mathbf{A} \mathbf{x} = cRn\mathbb{R}^n 中的一个椭球(ellipsoid),主轴方向由特征向量给定,半轴长度与 1/λi1/\sqrt{\lambda_i} 成正比。

与之相关的还有二次型的瑞利商(Rayleigh Quotient):

R(A,x)=xTAxxTx,x0R(\mathbf{A}, \mathbf{x}) = \frac{\mathbf{x}^T \mathbf{A} \mathbf{x}}{\mathbf{x}^T \mathbf{x}}, \qquad \mathbf{x} \neq \mathbf{0}

其值域为 [λmin,λmax][\lambda_{\min}, \lambda_{\max}]。此性质在主成分分析(PCA)和岭回归的收缩性质分析中起关键作用。

计量经济学中的应用

(一)OLS估计量的方差-协方差矩阵

在经典线性回归模型 y=Xβ+ε\mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\varepsilon} 中,普通最小二乘(OLS)估计量为 β^=(XTX)1XTy\hat{\boldsymbol{\beta}} = (\mathbf{X}^T \mathbf{X})^{-1} \mathbf{X}^T \mathbf{y}。其方差-协方差矩阵为:

Var(β^)=σ2(XTX)1\operatorname{Var}(\hat{\boldsymbol{\beta}}) = \sigma^2 (\mathbf{X}^T \mathbf{X})^{-1}

对于任一线性组合 cTβ^\mathbf{c}^T \hat{\boldsymbol{\beta}},其方差 σ2cT(XTX)1c\sigma^2 \mathbf{c}^T (\mathbf{X}^T \mathbf{X})^{-1} \mathbf{c} 恰为关于 c\mathbf{c} 的二次型。由于 XTX\mathbf{X}^T \mathbf{X} 正定(当 X\mathbf{X} 列满秩时),该方差恒为正。

(二)回归平方和的二次型表示

回归平方和(ESS)与残差平方和(RSS)均可写为 y\mathbf{y} 的二次型:

ESS=yT[X(XTX)1XT]y=yTPXy\text{ESS} = \mathbf{y}^T \left[\mathbf{X}(\mathbf{X}^T \mathbf{X})^{-1} \mathbf{X}^T\right] \mathbf{y} = \mathbf{y}^T \mathbf{P}_{\mathbf{X}} \mathbf{y}
RSS=yT[IPX]y=yTMXy\text{RSS} = \mathbf{y}^T \left[\mathbf{I} - \mathbf{P}_{\mathbf{X}}\right] \mathbf{y} = \mathbf{y}^T \mathbf{M}_{\mathbf{X}} \mathbf{y}

其中 PX\mathbf{P}_{\mathbf{X}} 为投影矩阵(幂等且对称),MX\mathbf{M}_{\mathbf{X}} 为残差生成矩阵。两者均为半正定矩阵——这是二次型正半定性在回归几何中的直接体现。进一步,FF 检验统计量可写为两个二次型之比:

F=yTQ1y/qyTQ2y/(nk)F = \frac{\mathbf{y}^T \mathbf{Q}_1 \mathbf{y} / q}{\mathbf{y}^T \mathbf{Q}_2 \mathbf{y} / (n-k)}

其中 Q1,Q2\mathbf{Q}_1, \mathbf{Q}_2 为适当的幂等矩阵。

(三)Wald检验与二次型

Wald检验统计量本质上是一个二次型。对于假设 H0:Rβ=rH_0: \mathbf{R}\boldsymbol{\beta} = \mathbf{r},Wald统计量为:

W=(Rβ^r)T[RVar^(β^)RT]1(Rβ^r)W = (\mathbf{R}\hat{\boldsymbol{\beta}} - \mathbf{r})^T \left[\mathbf{R} \operatorname{\hat{Var}}(\hat{\boldsymbol{\beta}}) \mathbf{R}^T\right]^{-1} (\mathbf{R}\hat{\boldsymbol{\beta}} - \mathbf{r})

H0H_0 下,Wdχq2W \xrightarrow{d} \chi^2_q,其分布理论完全依赖于正态随机向量的二次型性质。

二次型与随机向量的分布

zN(0,In)\mathbf{z} \sim N(\mathbf{0}, \mathbf{I}_n),则 zTAzχr2\mathbf{z}^T \mathbf{A} \mathbf{z} \sim \chi^2_r 当且仅当 A\mathbf{A} 为幂等矩阵且秩为 rr。更一般地,若 zN(μ,Σ)\mathbf{z} \sim N(\boldsymbol{\mu}, \mathbf{\Sigma}),则:

zTAzχr2(δ),δ=μTAμ\mathbf{z}^T \mathbf{A} \mathbf{z} \sim \chi^2_r(\delta), \qquad \delta = \boldsymbol{\mu}^T \mathbf{A} \boldsymbol{\mu}

AΣ\mathbf{A} \mathbf{\Sigma} 为幂等且 Σ\mathbf{\Sigma} 可逆时成立,其中 δ\delta 为非中心参数。这一系列结论是计量经济学中几乎所有假设检验——tt 检验、FF 检验、LM检验——的分布理论基础。

此外,两个二次型 zTAz\mathbf{z}^T \mathbf{A} \mathbf{z}zTBz\mathbf{z}^T \mathbf{B} \mathbf{z} 独立的条件为 AΣB=0\mathbf{A} \mathbf{\Sigma} \mathbf{B} = \mathbf{0}(Craig定理)。此性质在回归方差分析中保证ESS与RSS的独立性,从而确保FF统计量的分布推导有效。

最优化理论与海塞矩阵

在无约束最优化中,目标函数 f(x)f(\mathbf{x}) 在驻点 x\mathbf{x}^* 处的二阶泰勒展开为:

f(x+h)f(x)+12hT2f(x)hf(\mathbf{x}^* + \mathbf{h}) \approx f(\mathbf{x}^*) + \frac{1}{2} \mathbf{h}^T \nabla^2 f(\mathbf{x}^*) \mathbf{h}

其中 2f(x)\nabla^2 f(\mathbf{x}^*)海塞矩阵hT2fh\mathbf{h}^T \nabla^2 f \mathbf{h} 是一个二次型。极值的二阶充分条件直接等价于该二次型的定性:

  • 海塞矩阵正定     \iff 严格局部极小值
  • 海塞矩阵负定     \iff 严格局部极大值

在带约束优化中,加边海塞矩阵对应的二次型 vTxx2Lv\mathbf{v}^T \nabla^2_{\mathbf{x}\mathbf{x}} \mathcal{L} \cdot \mathbf{v}(约束在切空间 vTDg=0\mathbf{v}^T Dg = \mathbf{0} 上)的定性决定了条件极值的性质。消费者理论中效用最大化成本最小化的二阶条件即由此给出。

金融与投资组合理论

马科维茨均值-方差模型中,投资组合的方差是一个关于权重向量 w\mathbf{w} 的二次型:

σp2=wTΣw\sigma_p^2 = \mathbf{w}^T \mathbf{\Sigma} \mathbf{w}

其中 Σ\mathbf{\Sigma} 为资产收益率的协方差矩阵(至少半正定)。在最小方差组合的求解中,给定目标收益 μp\mu_p 及预算约束 wT1=1\mathbf{w}^T \mathbf{1} = 1,问题化为二次规划:

minw12wTΣws.t.wTμ=μp,wT1=1\min_{\mathbf{w}} \frac{1}{2} \mathbf{w}^T \mathbf{\Sigma} \mathbf{w} \quad \text{s.t.} \quad \mathbf{w}^T \boldsymbol{\mu} = \mu_p, \quad \mathbf{w}^T \mathbf{1} = 1

最优组合权重显式依赖于 Σ1\mathbf{\Sigma}^{-1},而分散化效应的大小取决于协方差矩阵的非对角元素——最小特征值对应的特征向量方向即为最小方差方向。

二次型与克罗内克积

在处理矩阵变量时,二次型与克罗内克积和向量化算子结合。例如,对于矩阵 X\mathbf{X} 和对称正定矩阵 Ω,Ψ\mathbf{\Omega}, \mathbf{\Psi},迹形式与二次型等价:

tr(XTΩXΨ)=vec(X)T(ΨΩ)vec(X)\operatorname{tr}(\mathbf{X}^T \mathbf{\Omega} \mathbf{X} \mathbf{\Psi}) = \operatorname{vec}(\mathbf{X})^T (\mathbf{\Psi} \otimes \mathbf{\Omega}) \operatorname{vec}(\mathbf{X})

这种表示在广义最小二乘(GLS)和面板数据模型的SUR(似不相关回归)估计中频繁出现,使得多方程系统的方差结构可以统一用二次型语言描述。