ARTICLE

真正率

真正率 (True Positive Rate, TPR) 真正率 (True Positive Rate, TPR)，也称为灵敏度 (Sensitivity) 或召回率 (Recall)，是二元分类和假设检验中评估分类/检测性能的核心指标之一。它衡量的是在所有实际为正的样本中，模型正确识别为正类的比例。直观而言，真正率回答的问题是：对于真正的阳性个体，模型

浏览 0 更新 2025-12-27

真正率 (True Positive Rate, TPR)

真正率 (True Positive Rate, TPR)，也称为灵敏度 (Sensitivity) 或召回率 (Recall)，是二元分类和假设检验中评估分类/检测性能的核心指标之一。它衡量的是在所有实际为正的样本中，模型正确识别为正类的比例。直观而言，真正率回答的问题是：对于真正的阳性个体，模型有多大的概率将其"抓出来"。

混淆矩阵与定义

理解真正率需要先引入混淆矩阵 (Confusion Matrix)。对于一个二元分类问题，模型的预测结果与实际标签交叉后可得到四种组合：

真正 (True Positive, TP)：实际为正，预测为正。
假负 (False Negative, FN)：实际为正，预测为负。
假正 (False Positive, FP)：实际为负，预测为正。
真负 (True Negative, TN)：实际为负，预测为负。

在此基础上，真正率定义为：

\mathrm{TPR} = \frac{\mathrm{TP}}{\mathrm{TP} + \mathrm{FN}} = \frac{\mathrm{TP}}{P}

其中 $P = \mathrm{TP} + \mathrm{FN}$ 表示实际正类样本的总数。TPR 的取值范围为 $[0, 1]$ ，数值越接近 1 表示模型的"命中率"越高。在医学诊断中，TPR 也被称为灵敏度，表示患有疾病（阳性）的个体被正确诊断出患病的概率。

与真正率相对应的另一关键指标是假正率 (False Positive Rate, FPR)，定义为 $\mathrm{FPR} = \frac{\mathrm{FP}}{\mathrm{FP} + \mathrm{TN}}$ ，衡量实际为负的样本中被错误判为正的比例。另一个相关概念是真负率 (True Negative Rate, TNR)，即特异度 (Specificity)，定义为 $\mathrm{TNR} = \frac{\mathrm{TN}}{\mathrm{TN} + \mathrm{FP}} = 1 - \mathrm{FPR}$ 。

与精确率和 F1 分数的关系

TPR（召回率）与精确率 (Precision) 共同构成了分类模型性能评估的一对核心指标。精确率定义为 $\mathrm{Precision} = \frac{\mathrm{TP}}{\mathrm{TP} + \mathrm{FP}}$ ，关注的是"预测为正的样本中有多少是真正的正类"。两者之间存在权衡：当模型提高阈值以增加精确率时，往往以牺牲召回率为代价，反之亦然。

为综合评估这一权衡，常使用F1分数 (F1-Score)，即精确率与召回率的调和平均：

F_1 = 2 \cdot \frac{\mathrm{Precision} \cdot \mathrm{Recall}}{\mathrm{Precision} + \mathrm{Recall}}

F1 分数在精确率与召回率同等重要的场景中尤为适用，例如信息检索和不平衡分类问题。

ROC 曲线与 AUC

真正率与假正率之间随分类阈值变化的轨迹构成了ROC曲线 (Receiver Operating Characteristic Curve)。ROC 曲线以 FPR 为横轴、TPR 为纵轴，描绘了分类器在所有可能阈值下 TPR 与 FPR 的 trade-off 关系。

一个理想的分类器应位于 ROC 空间的左上角，即 $\mathrm{TPR} = 1$ 且 $\mathrm{FPR} = 0$ 。随机猜测的分类器则沿对角线 $\mathrm{TPR} = \mathrm{FPR}$ 分布。ROC 曲线下的面积称为AUC (Area Under the Curve)，AUC 越大表示分类器的整体判别能力越强。

在假设检验的框架下，真正率等价于检验功效 (Power)，即当原假设为假时正确拒绝原假设的概率。此时，假正率等价于显著性水平 ( $\alpha$ )，即I类错误的概率；而 $1 - \mathrm{TPR}$ （即假负率）则为II类错误的概率 ( $\beta$ )。Neyman-Pearson 引理正是在给定 $\alpha$ 下最大化检验功效（即 TPR）的理论基础。

这一对应关系揭示了分类问题与统计检验之间的深层联系。在实践中，研究者可以通过调整分类阈值来控制 TPR 与 FPR 的相对大小：降低阈值通常能提高 TPR（增加功效），但也会抬高 FPR（增加 I 类错误风险）。这一权衡的本质与显著性水平和样本量之间的互动密切相关——在给定效应量下，更大的样本量可以在不牺牲 FPR 的前提下提升 TPR。

应用场景

真正率在多个学科中具有广泛的应用：

医学诊断与流行病学：评估一种诊断试剂或筛查方法发现患者的能力。高灵敏度测试适合用于疾病初筛，以减少漏诊风险。
机器学习与数据科学：在欺诈检测、垃圾邮件过滤和信用评分等场景中，真正率是模型评估的关键指标之一。
信号检测理论：在雷达探测、心理物理学等领域的信号检测论中，TPR 被称为"击中率" (Hit Rate)，是衡量观察者辨别信号能力的基本量度。
信息检索：在搜索引擎和文档检索系统中，召回率（即 TPR）衡量系统检索出所有相关文档的能力，通常与精确率搭配使用。

Bayesian 视角下的真正率

从Bayesian统计的角度来看，真正率可以理解为条件概率 $P(\hat{Y} = + \mid Y = +)$ ，即给定真实标签为正的条件下，模型预测也为正的概率。根据Bayes定理，这一概率与精确率 $P(Y = + \mid \hat{Y} = +)$ 之间通过先验概率（即类别的基础比率）相关联。具体而言：

P(\hat{Y} = + \mid Y = +) \cdot P(Y = +) = P(Y = + \mid \hat{Y} = +) \cdot P(\hat{Y} = +)

这一关系解释了为何在基础比率极低（如罕见病筛查， $P(Y = +)$ 接近零）的场景中，即使 TPR 很高，精确率仍可能非常低——因为绝大多数阳性预测实际上来自假正样本。理解这一 Bayesian 关系对正确解读诊断测试结果至关重要。

局限性与注意事项

尽管真正率是极具信息量的指标，但在实际应用中应注意以下几点：

第一，TPR 单独使用可能具有误导性。一个"懒惰分类器"可以通过将所有样本预测为正类来获得 $\mathrm{TPR} = 1$ ，但此时假正率也为 1，模型毫无实用价值。因此 TPR 必须与 FPR 或精确率联合考察。

第二，在类别不平衡 (Class Imbalance) 问题中，当正类样本极为稀少时，即使是高 TPR 也可能对应极低的精确率。此时应优先参考精确率-召回率曲线 (Precision-Recall Curve) 而非 ROC 曲线。

第三，TPR 对分类阈值敏感。在实际部署中，阈值的选择应取决于误分类的相对成本：当漏检（假负）的代价远高于误报（假正）时，应选择低阈值以追求高 TPR；反之，当误报代价高昂时，应选择高阈值以提高精确率和特异度。

第四，TPR 的计算依赖于真实标签的准确性。在半监督学习或无监督异常检测场景中，真实标签可能无法获取或存在标注噪声，此时 TPR 的估计会引入额外的不确定性。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。