ARTICLE

真负例

真负例 (True Negative) 真负例（True Negative，简称TN）是分类模型性能评估中的核心概念之一，指模型正确预测为负类（Negative）的样本。具体而言，当一个样本的真实标签为负类，且模型的预测结果也为负类时，该样本即被计为一个真负例。在混淆矩阵（Confusion Matrix）的框架中，真负例位于矩阵的实际为负·预测为负的单元格

浏览 0 更新 2025-07-18

真负例 (True Negative)

真负例（True Negative，简称TN）是分类模型性能评估中的核心概念之一，指模型正确预测为负类（Negative）的样本。具体而言，当一个样本的真实标签为负类，且模型的预测结果也为负类时，该样本即被计为一个真负例。在混淆矩阵（Confusion Matrix）的框架中，真负例位于矩阵的实际为负·预测为负的单元格中，与真正例（True Positive, TP）、假正例（False Positive, FP）和假负例（False Negative, FN）共同构成了分类结果的全景描述。

真负例的概念在医学检验、信息检索、机器学习和统计推断等领域具有广泛的适用性。以医学诊断中某种疾病筛查为例：若一名健康受检者的检测结果为阴性（未患病），则该结果即为一个真负例。真负例的数量本身并不直接反映模型性能的优劣，但它是计算多种关键评估指标的基础。

混淆矩阵中的定位与关系

在二分类问题中，给定一个包含正类和负类样本的数据集，分类器对每个样本做出预测，四类结果构成如下混淆矩阵：

真正例（TP）：实际为正类，预测为正类
真负例（TN）：实际为负类，预测为负类
假正例（FP）：实际为负类，预测为正类（第一类错误，弃真错误）
假负例（FN）：实际为正类，预测为负类（第二类错误，纳伪错误）

真负例和真正例代表模型的正确预测，而假正例和假负例代表错误预测。在数学上，总样本数量 $N$ 满足以下恒等式：

N = TP + TN + FP + FN

真负例的重要意义在于它同时参与了特异性（Specificity）和准确率（Accuracy）的计算。特异性的定义为：

\text{Specificity} = \frac{TN}{TN + FP}

特异性衡量模型正确识别负类样本的能力，在医学筛查、欺诈检测和安防监控等以负类为主体的场景中至关重要。在这类应用中，负类样本（如健康人群、合法交易）的体量往往远大于正类样本（如患者、欺诈交易），因此真负例的绝对数量可能很大，但真正有价值的性能指标是特异性而非TN的原始计数。

真负例在评估指标中的作用

准确率

准确率（Accuracy）是最直观的分类性能指标，定义为正确预测的样本占总样本的比例：

\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}

在类别不平衡（Class Imbalance）场景下——例如罕见病筛查中患病率仅为1\%——一个总是预测为负类的分类器也能达到99\%的准确率，因为TN占据了样本的绝大部分。此时准确率失去信息量，需要依赖精确率、召回率和F1分数等指标。

假正率与ROC曲线

假正率（False Positive Rate, FPR）是特异性（1 - Specificity）的互补指标：

FPR = \frac{FP}{FP + TN} = 1 - \text{Specificity}

在接收者操作特征曲线（ROC Curve）中，FPR为横轴，真正率（TPR）为纵轴。ROC曲线通过改变分类阈值遍历从(0,0)到(1,1)的空间，反映模型在不同判别严格程度下的性能折中。曲线下的面积（AUC）是模型排序能力的综合度量。

应用场景

医学诊断

在医学检验中，真负例对应健康受试者的阴性检测结果。以COVID-19核酸检测为例：真负例意味着受检者确实未感染且检测正确。高特异性（即高TN）是筛查的必要条件，因为假正例会导致不必要的隔离和恐慌。贝叶斯定理在此处发挥关键作用——即使特异性为99\%，如果疾病的先验概率很低，阳性预测值仍然可能很低，意味着阳性结果中假正例的比例不容忽视。

信息检索与垃圾邮件过滤

在垃圾邮件过滤任务中，正常邮件被标记为负类。一个真负例即正常邮件被正确归类。假正例（正常邮件被投入垃圾箱）对用户体验的伤害远大于假负例，因此过滤器设计通常以牺牲灵敏度来换取高特异性，即最大化TN。

信用评分与金融风控

在信用评分和反欺诈系统中，正常交易被定义为负类。低假正率（高TN）具有直接的经济意义：每一次假正例都可能引发客户投诉。风控模型通常采用成本敏感学习方法，对FP赋予更高的误分类代价，以引导模型产出更多的真负例。

小结

真负例（TN）是分类模型评估中不可或缺的组成部分，它与特异性、准确率、假正率和ROC曲线等核心概念紧密关联。在医学诊断、信息检索、金融风控等广泛应用中，理解和正确使用真负例是构建可靠分类系统的基础。然而，TN的绝对数值在类别不平衡和成本不对称的情况下具有误导性，需要结合具体问题的业务语境，通过特异性、精确率-召回率曲线和成本敏感评估等工具进行综合研判，才能对模型的真实性能做出客观判断。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。