ARTICLE

p值_(p-value)

p值 (p-value) p值（p-value），全称概率值（probability value），是假设检验框架中的核心统计指标。它衡量在零假设公式为真的前提下，观测到当前样本检验统计量或比其更极端情况的概率。p值的核心功能是量化样本数据与零假设之间的不一致程度，从而为决定是否拒绝零假设提供证据。简而言之，p值回答的问题是："如果零假设为真，我们观测到

浏览 15 更新 2025-11-01

p值 (p-value)

p值（p-value），全称概率值（probability value），是假设检验框架中的核心统计指标。它衡量在零假设 $H_0$ 为真的前提下，观测到当前样本检验统计量或比其更极端情况的概率。p值的核心功能是量化样本数据与零假设之间的不一致程度，从而为决定是否拒绝零假设提供证据。简而言之，p值回答的问题是："如果零假设为真，我们观测到的数据或更极端数据出现的概率有多大？"很小的p值意味着零假设下该结果是罕见事件，引导我们怀疑零假设并支持对立假设。

决策逻辑与计算方法

假设检验的标准流程：建立零假设和对立假设；设定显著性水平 $\alpha$ （常用0.05、0.01或0.10），代表愿意承担的第一类错误最大概率；计算检验统计量；计算p值；做出决策。决策规则：若 $p \le \alpha$ 则拒绝零假设，结果"统计显著"——有足够统计证据支持对立假设；若 $p > \alpha$ 则未能拒绝零假设——这不代表零假设一定为真，仅说明证据不足，可能因零假设确实为真或样本量太小导致统计功效不足。

法庭类推：零假设为"被告无罪"，p值类似"若被告真的无罪，出现如此不利证据的概率有多大"。p值极小则证据充分拒绝无罪假设，p值较大则只能"证据不足无法判定"而非"证明无罪"。

p值计算取决于检验方向和统计量的抽样分布。右尾检验（ $H_1$ 含">"）p值为 $P(T \ge t_{obs} | H_0)$ ；左尾检验（ $H_1$ 含"<"）p值为 $P(T \le t_{obs} | H_0)$ ；双尾检验（ $H_1$ 含" $\neq$ "）p值为两尾部面积之和——对对称分布为 $2 \times P(T \ge |t_{obs}| | H_0)$ 。

常见误解与正确理解

p值在统计实践中被广泛使用但也常被误解。以下是关键澄清：p值不是零假设为真的概率——p值是在假设零假设为真的条件下计算的，不能倒因为果。p值不是效应大小的度量——极小的p值可能对应极小的效应量，在大样本下尤其如此；必须结合效应量（如Cohen's d）和置信区间综合解读。p值不是结果可重复的概率——它仅衡量样本数据与特定零假设的证据强度，与可重复性不是同一个概念。p值敏感于样本量——大样本下微小差异也可能显著，但可能无实际意义；小样本下大效应可能不显著但可能具有重要实际价值。

近年来统计学界对p值滥用提出批判，美国统计协会（ASA）于2016年发布关于p值的正式声明强调：p值不能衡量效应大小或结果重要性；仅靠p值不能证明模型或假设；科学结论不应仅基于p值跨越某个阈值；正确推断需完整的报告和透明度。p值作为频率学派统计的基础工具仍然不可或缺，但在现代统计实践中越来越多地与效应量、置信区间、贝叶斯因子等指标联合使用，以提供更全面的证据图景。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。