ARTICLE

分类阈值

分类阈值 (Classification Threshold) 分类阈值（Classification Threshold），也称决策阈值（Decision Threshold），是二分类模型中用于将模型的连续输出（通常为预测概率或得分）映射为离散类别标签的临界值。在标准的二分类框架下，模型对每个样本输出一个介于 0 与 1 之间的预测概率 p，表示该样本属

浏览 0 更新 2025-12-13

分类阈值 (Classification Threshold)

分类阈值（Classification Threshold），也称决策阈值（Decision Threshold），是二分类模型中用于将模型的连续输出（通常为预测概率或得分）映射为离散类别标签的临界值。在标准的二分类框架下，模型对每个样本输出一个介于 0 与 1 之间的预测概率 $\hat{p}$ ，表示该样本属于正类的概率。分类阈值为一个预设的截断值 $c \in [0, 1]$ ：若 $\hat{p} \ge c$ ，则将样本预测为正类；若 $\hat{p} < c$ ，则预测为负类。阈值的选取直接影响分类器的各项性能指标，是实际应用中模型部署的关键决策。

阈值与分类性能的权衡

调整分类阈值会在真正率（True Positive Rate, TPR，也称灵敏度或召回率）和假正率（False Positive Rate, FPR）之间产生系统性的权衡。降低阈值使更多样本被预测为正类，提高真正率（捕获更多真实正例）但同时也提高假正率（更多负例被误判为正）；提高阈值的效果则相反。这一权衡由ROC曲线（Receiver Operating Characteristic Curve）完整刻画：ROC 曲线以假正率为横轴、真正率为纵轴，曲线上的每一点对应一个特定的分类阈值。

分类阈值的常用选取策略包括：默认阈值 $c = 0.5$ （假设正负类概率对称且误分类成本相等）；约登指数（Youden Index）法，即选择使 $J = \text{TPR} - \text{FPR}$ 最大化的阈值，等价于在ROC曲线上距离左上角最近的点；以及基于误分类成本的加权方法，当假阳性与假阴性的实际代价不同时（如疾病筛查中漏诊的代价远高于误报），应根据相对成本比来调整阈值。若假阴性代价为 $C_{FN}$ 、假阳性代价为 $C_{FP}$ ，最优阈值应使预期总成本最小化。

评估指标与阈值选择

不同应用场景对性能指标的偏好显著影响阈值的选取。在准确率（Accuracy）导向的场景中，通常采用默认阈值或通过交叉验证择优。在查准率（Precision）关键的应用（如垃圾邮件检测中误删正常邮件代价高昂），倾向提高阈值以降低假正率。在召回率（Recall）优先的应用（如癌症筛查中漏诊不可接受），倾向降低阈值以捕获更多真实正例。F1分数作为查准率与召回率的调和平均，可用于在两者间寻找平衡点，最佳阈值通常使F1最大化。PR曲线（Precision-Recall Curve）在类别不平衡严重时比ROC曲线更能体现模型性能差异。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。