张量 (Tensor)
张量(Tensor)是线性代数 与微分几何 中的核心概念,可视为标量(零阶张量)、向量(一阶张量)和矩阵(二阶张量)向任意维度的自然推广。张量提供了一种与坐标系选择无关的几何对象表示方法,使其在物理学 (如广义相对论 、连续介质力学)、机器学习 (如深度学习框架 TensorFlow 和 PyTorch)以及计量经济学 中均有广泛应用。张量的本质是一种多重线性映射:给定一个 m m m 维向量空间 V V V 及其对偶空间 V ∗ V^* V ∗ ,一个 ( r , s ) (r, s) ( r , s ) 型张量是将 r r r 个对偶向量和 s s s 个向量映射为一个标量的多重线性函数。
形式化定义
设 V V V 是域 R \mathbb{R} R 上的有限维向量空间,V ∗ V^* V ∗ 为其对偶空间。一个( r , s ) (r, s) ( r , s ) 型张量 (或称 r r r 阶逆变、s s s 阶协变张量)是一个多重线性映射:
T : V ∗ × ⋯ × V ∗ ⏟ r 个 × V × ⋯ × V ⏟ s 个 → R T: \underbrace{V^* \times \cdots \times V^*}_{r \text{ 个}} \times \underbrace{V \times \cdots \times V}_{s \text{ 个}} \to \mathbb{R} T : r 个 V ∗ × ⋯ × V ∗ × s 个 V × ⋯ × V → R
其阶 (Order 或 Rank)为 r + s r + s r + s 。在选定基底 { e 1 , … , e n } \{\mathbf{e}_1, \ldots, \mathbf{e}_n\} { e 1 , … , e n } 和对偶基底 { e 1 , … , e n } \{\mathbf{e}^1, \ldots, \mathbf{e}^n\} { e 1 , … , e n } 后,张量可表示为分量形式:
T = T j 1 ⋯ j s i 1 ⋯ i r e i 1 ⊗ ⋯ ⊗ e i r ⊗ e j 1 ⊗ ⋯ ⊗ e j s T = T^{i_1 \cdots i_r}_{j_1 \cdots j_s} \, \mathbf{e}_{i_1} \otimes \cdots \otimes \mathbf{e}_{i_r} \otimes \mathbf{e}^{j_1} \otimes \cdots \otimes \mathbf{e}^{j_s} T = T j 1 ⋯ j s i 1 ⋯ i r e i 1 ⊗ ⋯ ⊗ e i r ⊗ e j 1 ⊗ ⋯ ⊗ e j s
其中 T j 1 ⋯ j s i 1 ⋯ i r T^{i_1 \cdots i_r}_{j_1 \cdots j_s} T j 1 ⋯ j s i 1 ⋯ i r 为张量分量,上指标对应逆变(contravariant)分量,下指标对应协变(covariant)分量,⊗ \otimes ⊗ 表示张量积 ,且采用爱因斯坦求和约定 省略求和号。
协变与逆变
张量分量的上标与下标并非任意的记号惯例,而是反映了坐标变换下的不同行为。设坐标变换矩阵为 Λ j i = ∂ x ′ i ∂ x j \Lambda^i_j = \frac{\partial x'^i}{\partial x^j} Λ j i = ∂ x j ∂ x ′ i :
逆变分量 (上指标):按 T ′ i = Λ j i T j T'^i = \Lambda^i_j T^j T ′ i = Λ j i T j 变换,即随基底变换而同向变换。协变分量 (下指标):按 T i ′ = ( Λ − 1 ) i j T j T'_i = (\Lambda^{-1})^j_i T_j T i ′ = ( Λ − 1 ) i j T j 变换,即与基底变换反向变换。
这一区分在黎曼几何 中至关重要。度规张量 g i j g_{ij} g ij 是二阶协变张量,其逆 g i j g^{ij} g ij 为二阶逆变张量,两者用于指标的升降:T i = g i j T j T_i = g_{ij} T^j T i = g ij T j ,T i = g i j T j T^i = g^{ij} T_j T i = g ij T j 。在经济学应用中,当分析效用函数 在不同商品度量单位下的不变性时,张量分析提供了自然的数学语言。
张量运算
张量支持多种基本运算:
张量积 :若 A A A 为 ( r , s ) (r, s) ( r , s ) 型,B B B 为 ( p , q ) (p, q) ( p , q ) 型,则 A ⊗ B A \otimes B A ⊗ B 为 ( r + p , s + q ) (r+p, s+q) ( r + p , s + q ) 型张量,其分量为两者的乘积:
( A ⊗ B ) j 1 ⋯ j s + q i 1 ⋯ i r + p = A j 1 ⋯ j s i 1 ⋯ i r B j s + 1 ⋯ j s + q i r + 1 ⋯ i r + p (A \otimes B)^{i_1\cdots i_{r+p}}_{j_1 \cdots j_{s+q}} = A^{i_1\cdots i_r}_{j_1 \cdots j_s} \, B^{i_{r+1}\cdots i_{r+p}}_{j_{s+1}\cdots j_{s+q}} ( A ⊗ B ) j 1 ⋯ j s + q i 1 ⋯ i r + p = A j 1 ⋯ j s i 1 ⋯ i r B j s + 1 ⋯ j s + q i r + 1 ⋯ i r + p
缩并 (Contraction):将一个上指标与一个下指标配对并求和,使张量阶数降低 2。例如,对 ( 1 , 1 ) (1,1) ( 1 , 1 ) 型张量 T j i T^i_j T j i 的缩并得到标量 ∑ i T i i \sum_i T^i_i ∑ i T i i ,即矩阵的迹。
内积 :先做张量积再做缩并。向量点积 u ⋅ v = u i v i \mathbf{u} \cdot \mathbf{v} = u_i v^i u ⋅ v = u i v i 即为一阶张量经度规作用后的缩并。
张量分解
在高维数据分析中,CP分解 (CANDECOMP/PARAFAC)和Tucker分解 是两种核心的张量分解方法。对于三阶张量 X ∈ R I × J × K \mathcal{X} \in \mathbb{R}^{I \times J \times K} X ∈ R I × J × K :
CP分解将张量表示为秩一分量之和:X ≈ ∑ r = 1 R λ r a r ∘ b r ∘ c r \mathcal{X} \approx \sum_{r=1}^{R} \lambda_r \, \mathbf{a}_r \circ \mathbf{b}_r \circ \mathbf{c}_r X ≈ ∑ r = 1 R λ r a r ∘ b r ∘ c r 。 Tucker分解引入核张量:X ≈ G × 1 A × 2 B × 3 C \mathcal{X} \approx \mathcal{G} \times_1 A \times_2 B \times_3 C X ≈ G × 1 A × 2 B × 3 C ,其中 G \mathcal{G} G 为核张量,A , B , C A, B, C A , B , C 为因子矩阵。
这些分解在推荐系统 、计量经济学 的面板数据建模以及计量心理学 中用于从多维数据中提取潜在结构。
物理学中的应用
张量在物理学中的核心地位源于其坐标无关性 :物理定律用张量形式表达时,在所有参考系中保持相同形式。在广义相对论 中,爱因斯坦场方程 :
R μ ν − 1 2 g μ ν R + Λ g μ ν = 8 π G c 4 T μ ν R_{\mu\nu} - \frac{1}{2}g_{\mu\nu}R + \Lambda g_{\mu\nu} = \frac{8\pi G}{c^4} T_{\mu\nu} R μν − 2 1 g μν R + Λ g μν = c 4 8 π G T μν
其中 R μ ν R_{\mu\nu} R μν 为里奇张量 ,g μ ν g_{\mu\nu} g μν 为度规张量,T μ ν T_{\mu\nu} T μν 为应力-能量张量。该方程完全以二阶张量表述,描述了时空曲率与物质分布的耦合关系。在连续介质力学中,应力张量 σ i j \sigma_{ij} σ ij 和应变张量 ε i j \varepsilon_{ij} ε ij 均为二阶张量,用于描述材料内部力与形变的关系,广义胡克定律 即表述为 σ i j = C i j k l ε k l \sigma_{ij} = C_{ijkl} \varepsilon_{kl} σ ij = C ijk l ε k l ,其中 C i j k l C_{ijkl} C ijk l 为四阶弹性张量。
经济学与机器学习中的张量
在经济学中,张量方法正日益受到重视。多产品需求系统 的弹性矩阵本质上是二阶张量,其在不同商品分类方案下的变换遵循张量规则。面板数据中个体 × \times × 时间 × \times × 变量的三维结构天然适合张量建模。在计量经济学 的交错双重差分(Staggered DiD)估计中,处理效应随组别和时间变化的异质性可借助张量展开方法进行降维与估计。
在机器学习领域,张量 是深度学习框架的基本数据结构。TensorFlow 和 PyTorch 中的"Tensor"即为任意维度的多维数组。卷积神经网络中的特征图(Batch × \times × Height × \times × Width × \times × Channel)是四阶张量,Transformer 中的注意力权重(Batch × \times × Heads × \times × SeqLen × \times × SeqLen)同样为四阶张量。张量运算的 GPU 并行化是当代人工智能 算力的基石。此外,词嵌入矩阵(词汇量 × \times × 嵌入维度)是二阶张量,批量处理后的嵌入张量(Batch × \times × SeqLen × \times × EmbedDim)则为三阶张量,体现了张量维度随数据组织方式灵活变化的特点。
对称张量与反称张量
张量的对称性是重要的代数性质。对于二阶张量 T i j T_{ij} T ij :若 T i j = T j i T_{ij} = T_{ji} T ij = T ji ,则称该张量为对称张量 。度规张量 g i j g_{ij} g ij 、应力张量 σ i j \sigma_{ij} σ ij 均为对称张量,对称性意味着相应物理量在方向互换下保持不变。若 T i j = − T j i T_{ij} = -T_{ji} T ij = − T ji ,则称该张量为反称张量 。电磁张量 F μ ν F_{\mu\nu} F μν 是物理学中最重要的反称张量之一,其六个独立分量统一描述了电场和磁场。任意二阶张量可唯一分解为对称部分与反称部分之和:T i j = T ( i j ) + T [ i j ] T_{ij} = T_{(ij)} + T_{[ij]} T ij = T ( ij ) + T [ ij ] ,其中 T ( i j ) = 1 2 ( T i j + T j i ) T_{(ij)} = \frac{1}{2}(T_{ij} + T_{ji}) T ( ij ) = 2 1 ( T ij + T ji ) ,T [ i j ] = 1 2 ( T i j − T j i ) T_{[ij]} = \frac{1}{2}(T_{ij} - T_{ji}) T [ ij ] = 2 1 ( T ij − T ji ) 。这一分解在连续介质力学中将应变率张量分离为纯变形与旋转两个独立物理过程。在高阶张量中,全对称张量(如弹性张量 C i j k l C_{ijkl} C ijk l 满足 C i j k l = C j i k l = C i j l k = C k l i j C_{ijkl} = C_{jikl} = C_{ijlk} = C_{klij} C ijk l = C jik l = C ij l k = C k l ij )通过对称性约束大幅减少了独立分量数目,从而简化本构关系的参数估计。
与线性代数的关系
张量可视为线性代数向高阶的自然拓展,但两者之间存在本质差异。矩阵的秩(rank)定义为线性无关行(或列)的最大数目,而张量的秩定义为将其表示为秩一张量之和所需的最小项数,两者对于三阶及以上张量并不等价。此外,矩阵的谱分解和奇异值分解有自然的高阶推广,但高阶张量的最佳低秩逼近可能不存在,这一现象在矩阵中不会发生——这凸显了张量问题的独特复杂性与研究价值。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。