假设检验中的样本量计算
样本量计算是研究设计基础环节,预先估算所需最小参与者数,以确保足够统计功效检测有意义效应。在假设检验框架下平衡精度、成本和可行性。
四大核心要素
- 显著性水平 α:P(拒H0∣H0真),常规0.05/0.01。α↓→所需n↑
- 统计功效 1−β:P(拒H0∣H1真),常规0.80(把握80\%),关键研究0.90。功效↑→n↑
- 效应量:如Cohen's d = (μ1−μ2)/σ,相关系数 r,η2。基于文献/试验/临床意义确定。效应量↓(微小)→n↑↑
- 数据变异性 σ:数据离散度。变异性↑→n↑
公式与示例
双侧双样本均值比较(每组等样本):
n=(μ1−μ2)22(Zα/2+Z1−β)2σ2=d22(Zα/2+Z1−β)2
示例:降压药试验。α=0.05(Z0.025=1.96),功效0.80(Z0.80=0.84),σ=15mmHg,有意义差5mmHg。n=2⋅(1.96+0.84)2⋅152/52=2⋅7.84⋅225/25≈141.12→每组142人,总284人。
后果与考量
样本过小→第二类错误风险↑(真效应不可测→浪费资源且不道德);过大→浪费资金/时间/人力,让过多参与者承担风险。实践中:复杂设计需专门软件(G\*Power, R \texttt{pwr});预估参与者流失率上调初始招募数;资源受限时须在功效/效应量/α间权衡或声明功效不足。