统计独立 (Statistical Independence)
统计独立→概率论/统计基石概念→一事件发生或一随机变量取值不影响另一事件概率或另一变量分布。核心判据:联合=边际之积。统计模型与推断大多依赖独立假设。
事件独立
两事件A,B独立↔P(A∩B)=P(A)P(B)(乘法法则)↔P(A∣B)=P(A)(P(B)>0时)。后式直观:B发生与否不改变A的概率。例:52张牌抽红心(P=41)与抽K(P=131)→红心K概率521=41⋅131→独立。
多事件需区分两两独立(任意一对独立)与相互独立(任意子集交的概率=各自概率之积)→后者强于前者,两两独立不蕴含相互独立。统计中"独立"通常指相互独立。
独立≠互斥:互斥事件不能同时发生→A∩B=∅,P(A∩B)=0。若P(A),P(B)>0且独立则P(A∩B)>0→矛盾。互斥恰是强依赖:A发生则B必不发生(P(B∣A)=0=P(B))。
随机变量独立
X,Y独立↔联合CDF分解:FX,Y(x,y)=FX(x)FY(y),∀x,y。离散→联合PMFpX,Y=pXpY;连续→联合PDFfX,Y=fXfY→最常用检验法。多变量类似:联合分布=各边际分布之积。
关键性质
期望乘积:E[XY]=E[X]E[Y]→一般E[g(X)h(Y)]=E[g(X)]E[h(Y)]。
协方差为零:独立→Cov(X,Y)=E[XY]−E[X]E[Y]=0→相关系数ρ=0→无线性关系。
⚠零相关≠独立:不相关仅排除线性依赖。反例:X∼U[−1,1],Y=X2→Y完全由X决定但Cov=E[X3]−0=0→非线性依赖仍可能存在。只有正态分布等特殊情形下不相关等价于独立。
方差可加:独立→Var(X±Y)=Var(X)+Var(Y)→非独立时加±2Cov(X,Y)项。此性质简化大量推导。
矩生成函数分解:MX+Y(t)=MX(t)MY(t)→推导独立和分布(如独立泊松之和仍泊松,独立正态之和仍正态)。
统计应用
i.i.d.假设:样本X1,…,Xn独立同分布→统计推断(置信区间/假设检验)之基→若无此假设,经典方法失效。
回归分析:线性回归误差项εi独立假设→若违反(如时间序列中自相关)→OLS仍无偏但非有效→需GLS或Newey-West等修正。
中心极限定理:大量独立(或弱相关)随机变量均值近似正态分布→正态在统计中核心地位之源→即使总体非正态,大样本下推断仍有效。