ARTICLE
真阳性率
真阳性率 (True Positive Rate, TPR) 真阳性率(True Positive Rate,缩写 TPR),亦称灵敏度(Sensitivity)或召回率(Recall),是二分类预测评估中衡量模型识别正类能力的核心指标。其定义为:在所有实际为正类的样本中,被模型正确判定为正类的比例。公式为: 其中,TP(True Positive,真阳性)
真阳性率 (True Positive Rate, TPR)
真阳性率(True Positive Rate,缩写 TPR),亦称灵敏度(Sensitivity)或召回率(Recall),是二分类预测评估中衡量模型识别正类能力的核心指标。其定义为:在所有实际为正类的样本中,被模型正确判定为正类的比例。公式为:
其中,TP(True Positive,真阳性)为正类被正确预测为正类的样本数,FN(False Negative,假阴性)为正类被错误预测为负类的样本数。TPR 取值于 ,越接近 1 表示模型对正类的覆盖率越高。该概念源于统计决策理论和信号检测理论,其形式化可追溯至二战期间雷达信号辨识中的接收者操作特征分析。
与假设检验中统计功效的关系
真阳性率与假设检验中的统计功效(Statistical Power)在形式上等价。设原假设 对应于"样本为负类",备择假设 对应于"样本为正类",则:
其中 为第二类错误(Type II Error)概率,即漏报率(False Negative Rate, FNR)。这一等价性意味着 TPR 不仅是一个机器学习指标,更在计量经济学的模型推断中承载着检验敏感度的含义:功效越高的检验设计越不容易遗漏真实效应。在随机对照试验和工具变量分析中,弱工具变量检验的拒绝概率实质上就是该检验在面对真实内生偏误时的 TPR。
ROC 曲线与 AUC
TPR 是ROC 曲线(Receiver Operating Characteristic Curve)的纵轴,横轴为假阳性率(FPR = FP / (FP + TN))。通过连续变动分类阈值,可描绘出 TPR 随 FPR 变化的轨迹。ROC 曲线下面积(AUC)汇总了分类器在所有阈值下的整体区分能力:AUC = 1 表示完美分类器,AUC = 0.5 等价于随机猜测。在经济预测中,ROC 和 AUC 被广泛用于评估银行危机预警模型、企业破产预测(Altman Z-score等)以及信用评分卡的分辨力——此时 TPR 对应"正确识别违约客户的比例",FPR 对应"将正常客户误判为违约的比例"。
与其他指标的比较
TPR 仅关注正类的覆盖程度,并不反映预测的精确性。与之互补的核心指标包括:
- 精确率(Precision)= TP / (TP + FP):关注预测为正类的样本中有多少确实为正。TPR 与精确率往往彼此权衡——若降低分类阈值以提高 TPR,通常导致 FP 增加、精确率下降。两者的调和平均即为F1 分数:。
- 特异度(Specificity)= TN / (TN + FP) = 1 − FPR:衡量模型正确排除负类的能力,是 FPR 的补集,在医学筛查和反欺诈检测中尤其重要。
- 准确率(Accuracy)= (TP + TN) / (TP + TN + FP + FN):在类别严重不平衡时会高估模型表现——例如若正类仅占 1\%,始终预测负类就能获得 99\% 准确率,但 TPR = 0,彻底失去实用价值。这揭示了单独依赖准确率的危险和考察 TPR 的必要性。
经济学与计量经济学中的应用
TPR 在经济学实证研究中扮演多重角色。第一,在政策干预评估中,若将"政策有效"定义为正类,TPR 衡量研究设计正确识别出有效政策的概率,直接关联到政策推荐的可信度。第二,在二元选择模型(如Logit和Probit模型)的拟合优度评估中,以不同概率阈值计算 TPR 和 FPR 并绘制 ROC 曲线是标准做法,尤其在预测罕见事件——如金融危机、主权违约——时,研究者更关注高 TPR 区域的表现。第三,在劳动经济学的工资歧视研究中,Oaxaca-Blinder分解本身不涉及分类,但后续发展出使用分类器识别歧视性招聘模式的研究,TPR 可用于量化"正确检出不公平对待"的比率。第四,机器学习因果推断方法(如因果森林)在异质性处理效应识别中的性能评估常使用 TPR 作为衡量识别效率的指标。
局限性与注意事项
TPR 存在两个主要局限。首先,它孤立地衡量正类覆盖,忽略假阳性代价。在信贷审批中,TPR 的边际提升可能以大量错误授信(FP)为代价,造成直接坏账损失,因此实践中需结合成本敏感学习或通过 ROC 曲线的切线斜率(等于相对误分类成本比)来选择最优阈值。其次,TPR 依赖于正类的定义,在存在样本选择偏误或标签噪声时——如金融危机样本稀疏且标注存在争议——TPR 的估计值可能严重偏离真实值。为此,研究者应报告 TPR 的置信区间(通常通过Bootstrap重抽样获得),并辅以 Precision-Recall 曲线(在正类极度稀疏时比 ROC 更具信息量)进行稳健性分析。