ARTICLE
独立性检验
独立性检验 (Independence Test) 独立性检验判断两/分类变量是否统计独立→假设检验→核心分析列联表→比观测与期望频数→评估关联显著→社科/医学/调研标准工具。 设H_0:X⊥Y(P(X=i,Y=j)=P(X=i)P(Y=j)对所有i,j)→卡方独立性检验=最常用(皮尔逊)。 卡方检验 列联表r×c→期望频数E_ij=n_i·n_·j/n。统
独立性检验 (Independence Test)
独立性检验判断两/分类变量是否统计独立→假设检验→核心分析列联表→比观测与期望频数→评估关联显著→社科/医学/调研标准工具。
设:X⊥Y(对所有i,j)→卡方独立性检验=最常用(皮尔逊)。
卡方检验
列联表r×c→期望频数。统计量:→观测=期望时=0→偏越大值越大→下n足够大时。自由度:。
决策:设显著性水平=0.05→算→求p值观测值)→若p<→拒→变量显著相关;p≥→无足够证据。
条件:n≥50;各格≥5(至少80\%→无<1);随机抽样;观测独立。不满足→一型错误率偏离名义。
Fisher精确检验:2×2表或卡方条件不满足时→超几何分布→→精确p值(所有更极概率和)→适n<40/期望大<5/稀有事件。
例与相关概念
例:药A有效60/100,药B效40/100。期望皆=50→→df=1→临界→8.0>3.84→p=0.0047<0.05→拒→两药效显著异。
vs拟合优度:单变量vs两变量→观vs理论分布vs观联合vs独立期望。vs相关分析:连续→线性方强vs分类→任何形式关联。统计关联≠因果→可能有因/共同混杂/抽样偏/偶然。
功效+样本:大样→微差可显著→小样→真关联被掩。功效→样本↑/效应量↑/α↑→高。效应量=Phi系数/优势比。
高维→对数线性模型→→同检多元独立+交互。现代:蒙特卡洛→贝叶斯后验;R→\texttt{chisq.test()/fisher.test()};Python→\texttt{scipy.stats.chi2\_contingency}。常见误:忽条件检/过释p值/不当合并类/多重比不校。