ARTICLE

统计独立

统计独立 (Statistical Independence) 统计独立→概率论/统计基石概念→一事件发生或一随机变量取值不影响另一事件概率或另一变量分布。核心判据:联合=边际之积。统计模型与推断大多依赖独立假设。 事件独立 两事件A,B独立↔P(A B)=P(A)P(B)(乘法法则)↔P(A|B)=P(A)(P(B)>0时)。后式直观:B发生与否不改变A的

浏览 32 更新 2025-10-26

统计独立 (Statistical Independence)

统计独立概率论/统计基石概念→一事件发生或一随机变量取值不影响另一事件概率或另一变量分布。核心判据:联合=边际之积。统计模型与推断大多依赖独立假设。

事件独立

两事件A,B独立↔P(AB)=P(A)P(B)P(A\cap B)=P(A)P(B)(乘法法则)↔P(AB)=P(A)P(A|B)=P(A)P(B)>0P(B)>0时)。后式直观:B发生与否不改变A的概率。例:52张牌抽红心(P=14P=\frac14)与抽K(P=113P=\frac1{13})→红心K概率152=14113\frac1{52}=\frac14\cdot\frac1{13}→独立。

多事件需区分两两独立(任意一对独立)与相互独立(任意子集交的概率=各自概率之积)→后者强于前者,两两独立不蕴含相互独立。统计中"独立"通常指相互独立。

独立≠互斥互斥事件不能同时发生→AB=,P(AB)=0A\cap B=\varnothing,P(A\cap B)=0。若P(A),P(B)>0且独立则P(AB)>0P(A\cap B)>0→矛盾。互斥恰是强依赖:A发生则B必不发生(P(BA)=0P(B)P(B|A)=0\neq P(B))。

随机变量独立

X,Y独立↔联合CDF分解:FX,Y(x,y)=FX(x)FY(y),x,yF_{X,Y}(x,y)=F_X(x)F_Y(y),\forall x,y。离散→联合PMFpX,Y=pXpYp_{X,Y}=p_X p_Y;连续→联合PDFfX,Y=fXfYf_{X,Y}=f_X f_Y→最常用检验法。多变量类似:联合分布=各边际分布之积。

关键性质

期望乘积E[XY]=E[X]E[Y]E[XY]=E[X]E[Y]→一般E[g(X)h(Y)]=E[g(X)]E[h(Y)]E[g(X)h(Y)]=E[g(X)]E[h(Y)]

协方差为零:独立→Cov(X,Y)=E[XY]E[X]E[Y]=0Cov(X,Y)=E[XY]-E[X]E[Y]=0相关系数ρ=0\rho=0→无线性关系。

⚠零相关≠独立:不相关仅排除线性依赖。反例:XU[1,1],Y=X2X\sim U[-1,1],Y=X^2→Y完全由X决定但Cov=E[X3]0=0Cov=E[X^3]-0=0→非线性依赖仍可能存在。只有正态分布等特殊情形下不相关等价于独立。

方差可加:独立→Var(X±Y)=Var(X)+Var(Y)Var(X\pm Y)=Var(X)+Var(Y)→非独立时加±2Cov(X,Y)\pm2Cov(X,Y)项。此性质简化大量推导。

矩生成函数分解MX+Y(t)=MX(t)MY(t)M_{X+Y}(t)=M_X(t)M_Y(t)→推导独立和分布(如独立泊松之和仍泊松,独立正态之和仍正态)。

统计应用

i.i.d.假设:样本X1,,XnX_1,\ldots,X_n独立同分布→统计推断置信区间/假设检验)之基→若无此假设,经典方法失效。

回归分析线性回归误差项εi\varepsilon_i独立假设→若违反(如时间序列自相关)→OLS仍无偏但非有效→需GLSNewey-West等修正。

中心极限定理:大量独立(或弱相关)随机变量均值近似正态分布→正态在统计中核心地位之源→即使总体非正态,大样本下推断仍有效。