ARTICLE
置信水平
置信水平 (Confidence Level) 置信水平(Confidence Level),也称置信度,是统计推断中衡量通过样本数据构建的置信区间对总体参数估计可靠程度的概率值。它表示在大量重复抽样情况下,由样本构造出的置信区间中有多少比例能够包含真实的总体参数。置信水平表示为 1- ,其中 为显著性水平。常见的置信水平包括90\%( = 0.10)、95
置信水平 (Confidence Level)
置信水平(Confidence Level),也称置信度,是统计推断中衡量通过样本数据构建的置信区间对总体参数估计可靠程度的概率值。它表示在大量重复抽样情况下,由样本构造出的置信区间中有多少比例能够包含真实的总体参数。置信水平表示为 ,其中 为显著性水平。常见的置信水平包括90\%()、95\%()和99\%(),其中95\%是最为普遍的做法。
频率解释与常见误解
置信水平的正确频率解释是,若从同一总体中重复抽取n个样本,并用相同方法构造每次的95\%置信区间,长期中约95\%的置信区间将包含真实参数。任一单次抽样区间"包含参数的置信水平为95\%",并非"参数落入该区间的概率为95\%",后者是贝叶斯可信区间的解释。在频率学派中,参数为固定未知常数,置信水平指构造方法的长期频率性质,而非单次计算的后验概率。
具体表达式为,对于总体均值 ,在总体标准差 已知且总体服从正态分布的条件下,置信水平 的双侧置信区间为 。其中 为标准正态分布的上 分位数即临界值,随置信水平升高而变大,区间宽度随之增加。更高置信度以更宽的区间为代价。样本量n增大时,区间宽度按 比例缩小,精度相应提升。
与假设检验的关系
置信水平与双尾检验的显著性水平具有直接的对偶关系。参数 的 置信区间包含零假设值 ,当且仅当双侧显著性水平 的检验不能拒绝 。区间排除 等价于拒绝 。这一对偶性在计量经济学中使置信区间不仅提供估计的变异信息,也为所有可能的零假设提供了一个统一的拒绝规则。区间越窄,精度越高,能为理论检验提供更精确的证据。报告置信区间而非仅p值是良好统计实践的基本要求。