ARTICLE

子sigma-代数

子σ-代数 (Sub-σ-Algebra) 子σ-代数 (Sub-σ-Algebra) 是测度论和概率论中的一个核心概念,用于描述一个较大的σ-代数内部的、自身也构成σ-代数的子集族。它在形式化"信息"这一直观概念方面扮演着不可替代的角色,是现代概率论中条件期望、鞅 (Martingale) 理论以及随机过程研究的语言基础。 σ-代数的回顾 在定义子σ-代数

浏览 0 更新 2025-12-29

子σ-代数 (Sub-σ-Algebra)

子σ-代数 (Sub-σ-Algebra) 是测度论概率论中的一个核心概念,用于描述一个较大的σ-代数内部的、自身也构成σ-代数的子集族。它在形式化"信息"这一直观概念方面扮演着不可替代的角色,是现代概率论中条件期望 (Martingale) 理论以及随机过程研究的语言基础。

σ-代数的回顾

在定义子σ-代数之前,必须首先理解什么是σ-代数。

Ω \Omega 为一个非空集合(在概率论中称为样本空间),F \mathcal{F} Ω \Omega 的子集构成的集族(即 F2Ω \mathcal{F} \subseteq 2^\Omega )。我们称 F \mathcal{F} Ω \Omega 上的一个 σ-代数(或σ-域),当且仅当它满足以下三个条件:

  1. 包含全集ΩF \Omega \in \mathcal{F}
  2. 对补集封闭:若 AF A \in \mathcal{F} ,则其补集 Ac=ΩAF A^c = \Omega \setminus A \in \mathcal{F}
  3. 对可数并封闭:若 A1,A2,F A_1, A_2, \dots \in \mathcal{F} 为一可数序列,则 i=1AiF \bigcup_{i=1}^{\infty} A_i \in \mathcal{F}

在概率论的框架下,F \mathcal{F} 中的每一个集合被称为一个事件 (Event),而σ-代数的上述三条性质恰好保证了我们可以对事件进行逻辑运算("非"对应补集,"或"对应可数并)而不会超出可测事件的范围。(Ω,F) (\Omega, \mathcal{F}) 被称为可测空间 (Measurable Space),在此基础上赋予一个概率测度 P \mathbb{P} ,就构成了完整的概率空间 (Ω,F,P) (\Omega, \mathcal{F}, \mathbb{P})

子σ-代数的定义

现在我们可以自然地定义子σ-代数。设 F \mathcal{F} Ω \Omega 上的一个σ-代数,G \mathcal{G} F \mathcal{F} 的一个子集族(即 GF \mathcal{G} \subseteq \mathcal{F} )。若 G \mathcal{G} 自身也满足σ-代数的三条公理,则称 G \mathcal{G} F \mathcal{F} 的一个 子σ-代数 (Sub-σ-Algebra)。

用数学符号表示为:

GF,且 G 自身是一个 σ-代数\mathcal{G} \subseteq \mathcal{F}, \quad \text{且 } \mathcal{G} \text{ 自身是一个 } \sigma\text{-代数}

关键洞察:子σ-代数的本质在于它包含的集合比原始σ-代数"更少",因此它能够区分的样本点也"更粗糙"。这正是"信息"概念的数学体现——σ-代数越小,它能提供的"分辨率"越低。G \mathcal{G} 中的事件集合,就是那些在给定部分信息下我们能够判定其是否发生的事件。

常见示例

1. 平凡σ-代数 (Trivial σ-Algebra)

对于任何样本空间 Ω \Omega ,集合族 G0={,Ω} \mathcal{G}_0 = \{\emptyset, \Omega\} 是一个σ-代数。它是任何σ-代数 F \mathcal{F} 的子σ-代数,因为它只包含必然不发生的事件 \emptyset 和必然发生的事件 Ω \Omega ,不包含任何其他实质性的信息。它代表零信息——除了知道"某事必然发生或不发生"之外,一无所知。

2. 由随机变量生成的子σ-代数

这是概率论中最为重要的一类子σ-代数。设 X:ΩR X : \Omega \to \mathbb{R} 是一个随机变量。我们定义:

σ(X)={X1(B):BB(R)}\sigma(X) = \{ X^{-1}(B) : B \in \mathcal{B}(\mathbb{R}) \}

其中 B(R) \mathcal{B}(\mathbb{R}) 是实数轴上的Borel σ-代数X1(B)={ωΩ:X(ω)B} X^{-1}(B) = \{\omega \in \Omega : X(\omega) \in B\} B B X X 下的原像。

σ(X) \sigma(X) 是使得 X X 可测的 最小σ-代数,它代表了"观测 X X 的值所能获得的全部信息"。如果另一个随机变量 Y Y 关于 σ(X) \sigma(X) 可测(记为 Yσ(X) Y \in \sigma(X) ),那么从测度论的角度,存在一个 Borel 可测函数 g g 使得 Y=g(X) Y = g(X) ,即知道 X X 的取值就完全确定了 Y Y 的取值——这正是 Doob-Dynkin 引理的内容。

例如,抛掷一枚公平硬币两次:Ω={HH,HT,TH,TT} \Omega = \{HH, HT, TH, TT\} 。设随机变量 X X 表示第一次抛掷的结果(正面记为1,反面记为0)。那么:

σ(X)={,Ω,{HH,HT},{TH,TT}}\sigma(X) = \{ \emptyset, \Omega, \{HH, HT\}, \{TH, TT\} \}

这个子σ-代数只能区分第一次抛掷的结果是正面还是反面——它只有四个事件,远少于 Ω \Omega 的全部 24=16 2^4 = 16 个子集构成的σ-代数。它精确地捕捉了"只观测第一次抛掷"这个实验的信息结构。

3. 分割生成的σ-代数

{A1,A2,,An} \{A_1, A_2, \dots, A_n\} 是样本空间 Ω \Omega 的一个有限分割(即这些集合两两不交且并集为 Ω \Omega )。则由这个分割生成的σ-代数 G \mathcal{G} 由分割中集合的所有可能的并集(包括空集)构成。G \mathcal{G} 中恰好有 2n 2^n 个事件。每个事件对应"我们只知道样本点落入分割的哪些块,而无法区分同一块内的样本点"。

这类σ-代数在初等概率论中对应着有限信息结构,常用于阐释条件期望在离散情形下的计算。

子σ-代数与信息

将子σ-代数视为信息的数学载体,是现代概率论中最深刻的观点之一。我们可以通过以下对应关系来理解:

| 概念 | 数学对象 | 直觉含义 | |------|---------|---------| | 完全信息 | F \mathcal{F} | 知道样本空间中的每一个可测事件的答案 | | 部分信息 | 子σ-代数 GF \mathcal{G} \subseteq \mathcal{F} | 只能回答属于 G \mathcal{G} 的事件是否发生 | | 完全无知 | 平凡σ-代数 {,Ω} \{\emptyset, \Omega\} | 对任何实质性事件都无法判定 |

当我们说"已知子σ-代数 G \mathcal{G} 所包含的信息",我们指的是:对于 G \mathcal{G} 中的每一个事件 A A ,我们确切知道 ωA \omega \in A 是否成立。但对于 FG \mathcal{F} \setminus \mathcal{G} 中的事件,我们无法做出确定性判断。

条件期望:子σ-代数的核心应用

子σ-代数最重要的应用在于定义关于σ-代数的条件期望。给定概率空间 (Ω,F,P) (\Omega, \mathcal{F}, \mathbb{P}) 上的可积随机变量 X X 和子σ-代数 GF \mathcal{G} \subseteq \mathcal{F} ,我们定义 X X 关于 G \mathcal{G} 的条件期望 E[XG] \mathbb{E}[X \mid \mathcal{G}] 为满足以下两个条件的随机变量 Y Y

  1. G \mathcal{G} -可测性Y Y 关于 G \mathcal{G} 可测(即 Y Y 是基于 G \mathcal{G} 中的信息可以确定的)。
  2. 部分平均性质:对任意 GG G \in \mathcal{G} ,有 GYdP=GXdP \int_G Y \, d\mathbb{P} = \int_G X \, d\mathbb{P}

这种基于子σ-代数的定义方式统一了初等概率论中各种条件期望的形式:当 G=σ(Y) \mathcal{G} = \sigma(Y) 时,E[XG] \mathbb{E}[X \mid \mathcal{G}] 就是 X X 在给定随机变量 Y Y 下的条件期望 E[XY] \mathbb{E}[X \mid Y] ;当 G={,Ω} \mathcal{G} = \{\emptyset, \Omega\} 时,E[XG]=E[X] \mathbb{E}[X \mid \mathcal{G}] = \mathbb{E}[X] ,即退化为无条件期望。这使得子σ-代数成为连接初等条件期望和测度论条件期望的桥梁。

滤子 (Filtration)

子σ-代数的另一个核心应用是 滤子 (Filtration)。滤子是一个随时间递增的σ-代数族 {Ft}t0 \{\mathcal{F}_t\}_{t \ge 0} ,满足对任意 st s \le t ,有 FsFtF \mathcal{F}_s \subseteq \mathcal{F}_t \subseteq \mathcal{F}

滤子形式化了"信息随时间不断累积"这一直观概念:在时间 s s ,我们拥有信息 Fs \mathcal{F}_s ;到了时间 t>s t > s ,我们拥有更多的信息 Ft \mathcal{F}_t (即 Fs \mathcal{F}_s Ft \mathcal{F}_t 的子σ-代数)。随机过程 {Xt} \{X_t\} 若满足每个 Xt X_t 关于 Ft \mathcal{F}_t 可测,则称该过程是 {Ft} \{\mathcal{F}_t\} -适应的 (Adapted)——这意味着过程在时刻 t t 的值仅依赖于到时刻 t t 为止的可用信息,没有"预知未来"。

滤子理论是 (Martingale)、马尔可夫过程以及随机积分理论的基石。例如,布朗运动 Bt B_t 的自然滤子定义为 Ft=σ({Bs:st}) \mathcal{F}_t = \sigma(\{B_s : s \le t\}) ,即到时刻 t t 为止布朗运动所生成的全部信息。

独立性与子σ-代数

两个子σ-代数 G \mathcal{G} H \mathcal{H} 被称为独立的,当且仅当对任意 GG G \in \mathcal{G} HH H \in \mathcal{H} ,有 P(GH)=P(G)P(H) \mathbb{P}(G \cap H) = \mathbb{P}(G) \mathbb{P}(H) 。这一概念将随机变量之间的独立性推广到了信息结构层面:两个子σ-代数的独立性意味着掌握其中一个包含的任何信息,都无法对另一个中包含的事件提供任何判断依据。这一推广对于理解强大数定律的证明以及随机过程的深入分析至关重要。

总结

子σ-代数是测度论概率论的语言基础设施。它将"信息"——这一在初等概率论中只能通过"已知某个随机变量的值"来模糊表述的概念——转化为精确的数学结构。从平凡σ-代数的零信息,到由随机变量生成的有限信息,再到随时间演化的滤子,子σ-代数提供了一个统一的框架:信息即区分能力,子σ-代数越小,所能区分的可能性越粗糙。条件期望、鞅论、马尔可夫过程、随机微积分这些现代概率论与随机分析的核心理论,都建立在子σ-代数这一基础概念之上。