独立的随机变量 (Independent Random Variables)
独立的随机变量 (Independent Random Variables) 是概率论 和数理统计 中最基础的概念之一。直观地说,两个随机变量独立意味着其中一个的取值不会对另一个的取值提供任何信息。这一概念是大数定律 、中心极限定理 等几乎所有概率论核心结论的基石。
定义
设 X X X 和 Y Y Y 是定义在同一概率空间上的两个随机变量。如果对于任意实数 x x x 和 y y y ,事件 { X ≤ x } \{X \leq x\} { X ≤ x } 与 { Y ≤ y } \{Y \leq y\} { Y ≤ y } 相互独立,即
P ( X ≤ x , Y ≤ y ) = P ( X ≤ x ) ⋅ P ( Y ≤ y ) , ∀ x , y ∈ R , P(X \leq x,\ Y \leq y) = P(X \leq x) \cdot P(Y \leq y), \quad \forall x, y \in \mathbb{R}, P ( X ≤ x , Y ≤ y ) = P ( X ≤ x ) ⋅ P ( Y ≤ y ) , ∀ x , y ∈ R ,
则称 X X X 与 Y Y Y 相互独立 ,记为 X ⊥ ⊥ Y X \perp\!\!\!\perp Y X ⊥ ⊥ Y 。用累积分布函数 表述:联合分布函数等于边际分布函数的乘积,即 F X , Y ( x , y ) = F X ( x ) ⋅ F Y ( y ) F_{X,Y}(x,y) = F_X(x) \cdot F_Y(y) F X , Y ( x , y ) = F X ( x ) ⋅ F Y ( y ) 。
将定义推广到 n n n 个随机变量:X 1 , … , X n X_1,\ldots,X_n X 1 , … , X n 相互独立 当且仅当
F X 1 , … , X n ( x 1 , … , x n ) = ∏ i = 1 n F X i ( x i ) , ∀ x 1 , … , x n ∈ R . F_{X_1,\ldots,X_n}(x_1,\ldots,x_n) = \prod_{i=1}^n F_{X_i}(x_i), \quad \forall x_1,\ldots,x_n \in \mathbb{R}. F X 1 , … , X n ( x 1 , … , x n ) = i = 1 ∏ n F X i ( x i ) , ∀ x 1 , … , x n ∈ R .
离散型与连续型随机变量
对于离散型随机变量 ,独立等价于联合概率质量函数的因子分解:p X , Y ( x , y ) = p X ( x ) p Y ( y ) p_{X,Y}(x,y) = p_X(x) p_Y(y) p X , Y ( x , y ) = p X ( x ) p Y ( y ) 。对于连续型随机变量 ,独立等价于联合概率密度函数的因子分解:f X , Y ( x , y ) = f X ( x ) f Y ( y ) f_{X,Y}(x,y) = f_X(x) f_Y(y) f X , Y ( x , y ) = f X ( x ) f Y ( y ) 。
独立性与不相关性
独立与不相关 是两个常被混淆的概念。若 X X X 与 Y Y Y 独立且期望存在,则 Cov ( X , Y ) = 0 \operatorname{Cov}(X,Y) = 0 Cov ( X , Y ) = 0 ,即独立推得不相关 。但反之不成立:例如 X ∼ N ( 0 , 1 ) X \sim N(0,1) X ∼ N ( 0 , 1 ) ,Y = X 2 Y = X^2 Y = X 2 ,则 Cov ( X , Y ) = 0 \operatorname{Cov}(X,Y) = 0 Cov ( X , Y ) = 0 但 X X X 与 Y Y Y 并不独立。唯一的例外是多元正态分布 :对于联合正态随机变量,不相关等价于独立。
关键性质
独立随机变量具有以下重要性质:
期望的乘积性 :E [ X Y ] = E [ X ] ⋅ E [ Y ] E[XY] = E[X] \cdot E[Y] E [ X Y ] = E [ X ] ⋅ E [ Y ] 。方差的可加性 :Var ( X + Y ) = Var ( X ) + Var ( Y ) \operatorname{Var}(X+Y) = \operatorname{Var}(X) + \operatorname{Var}(Y) Var ( X + Y ) = Var ( X ) + Var ( Y ) 。函数的独立性 :若 X X X 与 Y Y Y 独立,则对任意可测函数 g , h g, h g , h ,g ( X ) g(X) g ( X ) 与 h ( Y ) h(Y) h ( Y ) 也独立。矩母函数的分解 :M X + Y ( t ) = M X ( t ) ⋅ M Y ( t ) M_{X+Y}(t) = M_X(t) \cdot M_Y(t) M X + Y ( t ) = M X ( t ) ⋅ M Y ( t ) 。
独立同分布 (i.i.d.)
若随机变量 X 1 , … , X n X_1,\ldots,X_n X 1 , … , X n 相互独立且服从相同的分布 F F F ,则称其为独立同分布 (i.i.d.) 样本。i.i.d. 假设是大数定律 和中心极限定理 等渐近理论的出发点,也是经典统计推断的基石。
条件独立性
条件独立 是独立性的重要推广。给定 Z Z Z ,称 X X X 与 Y Y Y 条件独立 ,如果
P ( X ≤ x , Y ≤ y ∣ Z = z ) = P ( X ≤ x ∣ Z = z ) ⋅ P ( Y ≤ y ∣ Z = z ) , ∀ x , y , z . P(X \leq x, Y \leq y \mid Z = z) = P(X \leq x \mid Z = z) \cdot P(Y \leq y \mid Z = z), \quad \forall x, y, z. P ( X ≤ x , Y ≤ y ∣ Z = z ) = P ( X ≤ x ∣ Z = z ) ⋅ P ( Y ≤ y ∣ Z = z ) , ∀ x , y , z .
条件独立性在贝叶斯网络 和图模型 中扮演核心角色。
总结
独立随机变量的本质是联合分布可以因子分解为边际分布的乘积。独立性强于不相关性,但对于正态分布两者等价。i.i.d. 假设支撑着几乎所有渐近理论,是统计学最重要的概念之一。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。