二项检验 (Binomial Test)
二项检验 (Binomial Test) 是一种基于 二项分布 的精确 假设检验,用于判断 伯努利试验 中成功概率 p 是否与某个指定值 p0 存在显著差异。
定义与假设
设 X∼Binomial(n,p),即 n 次独立重复试验中成功的次数。检验问题为:
H0:p=p0vsH1:p=p0(双侧),p>p0(右侧),p<p0(左侧)
检验统计量即为观测成功次数 x。在 H0 下,X∼Binomial(n,p0),概率质量函数 为:
P(X=k)=(kn)p0k(1−p0)n−k,k=0,1,…,n
p 值计算
二项检验的 p 值直接基于二项分布精确计算,无需渐近近似:
- 右侧检验:p-value=P(X≥x∣H0)=∑k=xn(kn)p0k(1−p0)n−k
- 左侧检验:p-value=P(X≤x∣H0)=∑k=0x(kn)p0k(1−p0)n−k
- 双侧检验:p-value=2×min{P(X≤x),P(X≥x)},或取所有概率不高于 P(X=x) 的 k 对应概率之和
当 p 值小于显著性水平 α(通常取 0.05)时拒绝 H0。
正态近似
当 n 充分大且 np0(1−p0)>5 时,可由 中心极限定理 构造 Z 检验:
Z=p0(1−p0)/np^−p0dN(0,1)
其中 p^=x/n 为样本比例。此时可使用 标准正态分布 计算近似 p 值。对于小样本或极端概率,精确二项检验更为可靠。
与其它检验的关系
- 符号检验 (Sign Test):二项检验的特例,取 p0=0.5,用于配对比较中判断中位数是否为零。
- McNemar 检验:用于配对二分类数据的边际同质性检验,其条件分布本质为二项分布。
- Fisher 精确检验:虽基于 超几何分布,但二者同属精确检验家族,适用于小样本或稀疏数据场景。
经济学与科学应用
- 市场调研:检验消费者偏好比例是否显著偏离 50\%,用于 A/B 测试中判断新方案是否优于旧方案。
- 质量控制:从一批产品中抽样,检验次品率是否超过行业标准 p0,为 抽样检验 提供决策依据。
- 医学统计:检验某种疗法的有效率是否显著高于安慰剂,是临床 II 期试验 的常用工具。
- 行为经济学:检验受试者在某决策任务中选择风险选项的比例是否偏离随机选择,用于验证 前景理论 的预测。
注意事项
- 二项检验的 功效 (Statistical Power) 随样本量 n 增大而提高,小样本时可能无法检出实际差异。
- 精确二项检验是保守的——实际犯 第一类错误 的概率通常略低于名义水平 α。
- 在统计软件中(如 \texttt{R} 的 \texttt{binom.test}、\texttt{scipy.stats.binomtest})均可直接调用精确二项检验。