ARTICLE
分类阈值
分类阈值 (Classification Threshold) 分类阈值(Classification Threshold),也称决策阈值(Decision Threshold),是二分类模型中用于将模型的连续输出(通常为预测概率或得分)映射为离散类别标签的临界值。在标准的二分类框架下,模型对每个样本输出一个介于 0 与 1 之间的预测概率 p,表示该样本属
分类阈值 (Classification Threshold)
分类阈值(Classification Threshold),也称决策阈值(Decision Threshold),是二分类模型中用于将模型的连续输出(通常为预测概率或得分)映射为离散类别标签的临界值。在标准的二分类框架下,模型对每个样本输出一个介于 0 与 1 之间的预测概率 ,表示该样本属于正类的概率。分类阈值为一个预设的截断值 :若 ,则将样本预测为正类;若 ,则预测为负类。阈值的选取直接影响分类器的各项性能指标,是实际应用中模型部署的关键决策。
阈值与分类性能的权衡
调整分类阈值会在真正率(True Positive Rate, TPR,也称灵敏度或召回率)和假正率(False Positive Rate, FPR)之间产生系统性的权衡。降低阈值使更多样本被预测为正类,提高真正率(捕获更多真实正例)但同时也提高假正率(更多负例被误判为正);提高阈值的效果则相反。这一权衡由ROC曲线(Receiver Operating Characteristic Curve)完整刻画:ROC 曲线以假正率为横轴、真正率为纵轴,曲线上的每一点对应一个特定的分类阈值。
分类阈值的常用选取策略包括:默认阈值 (假设正负类概率对称且误分类成本相等);约登指数(Youden Index)法,即选择使 最大化的阈值,等价于在ROC曲线上距离左上角最近的点;以及基于误分类成本的加权方法,当假阳性与假阴性的实际代价不同时(如疾病筛查中漏诊的代价远高于误报),应根据相对成本比来调整阈值。若假阴性代价为 、假阳性代价为 ,最优阈值应使预期总成本最小化。
评估指标与阈值选择
不同应用场景对性能指标的偏好显著影响阈值的选取。在准确率(Accuracy)导向的场景中,通常采用默认阈值或通过交叉验证择优。在查准率(Precision)关键的应用(如垃圾邮件检测中误删正常邮件代价高昂),倾向提高阈值以降低假正率。在召回率(Recall)优先的应用(如癌症筛查中漏诊不可接受),倾向降低阈值以捕获更多真实正例。F1分数作为查准率与召回率的调和平均,可用于在两者间寻找平衡点,最佳阈值通常使F1最大化。PR曲线(Precision-Recall Curve)在类别不平衡严重时比ROC曲线更能体现模型性能差异。