ARTICLE
伪R平方
伪R平方(Pseudo R-squared)是一类用于广义线性模型(尤其是逻辑回归和泊松回归)中衡量模型拟合优度的统计指标的统称。与经典线性回归中的决定系数(R平方)不同,伪R平方并非解释因变量方差的百分比,而是通过似然函数、预测正确率或信息准则等途径间接评估模型的解释力。由于广义线性模型的最大似然估计不基于最小化残差平方和,传统R平方的定义在此框架下失去了
伪R平方(Pseudo R-squared)是一类用于广义线性模型(尤其是逻辑回归和泊松回归)中衡量模型拟合优度的统计指标的统称。与经典线性回归中的决定系数(R平方)不同,伪R平方并非解释因变量方差的百分比,而是通过似然函数、预测正确率或信息准则等途径间接评估模型的解释力。由于广义线性模型的最大似然估计不基于最小化残差平方和,传统R平方的定义在此框架下失去了数学基础,因而产生了多种替代性度量——这些度量被统称为伪R平方。常见的伪R平方包括McFadden伪R平方、Cox-Snell伪R平方、Nagelkerke伪R平方、Efron伪R平方以及计数伪R平方等,每种度量方法的构造逻辑和解读方式各有差异。
McFadden伪R平方
McFadden伪R平方由经济学家丹尼尔·麦克法登(Daniel McFadden)于1974年提出,是基于似然比(likelihood ratio)的最广泛使用的伪R平方之一。其定义为:
其中,是包含所有解释变量的完整模型的似然函数值,是仅包含截距项的零模型的似然函数值。由于(完整模型的似然值不可能低于零模型),McFadden伪R平方的取值介于0到1之间。值越接近1,表示完整模型相较于零模型的似然改进越大。麦克法登本人曾给出经验性判断标准:0.2至0.4之间的值即代表"非常好"的拟合——这一标准远低于传统R平方的直觉印象,因为在最大似然框架下,伪R平方的数值普遍偏低。由于McFadden伪R平方依赖于比较模型与零模型的似然差异,它在嵌套模型的比较中具有直观的理论含义,且不受样本量波动的影响,是离散选择模型中最受推荐的拟合优度指标。
Cox-Snell伪R平方
Cox-Snell伪R平方由戴维·科克斯(David Cox)和乔伊·斯内尔(Joy Snell)于1989年提出,其构造思路是使伪R平方的公式在线性回归的普通最小二乘法特例下退化为传统R平方。其定义为:
其中是样本量。Cox-Snell伪R平方的一个显著缺陷是其理论上界小于1——即使模型完美拟合数据,该指标仅能达到,这在高截距或高基线概率模型中尤为突出。这一上限约束使得Cox-Snell伪R平方在不同模型之间的可比性受到限制,研究者难以直观判断一个给定数值是否代表"良好"的拟合。由于这一不足,该指标在实际应用中的受欢迎程度低于McFadden伪R平方。
Nagelkerke伪R平方
Nagelkerke伪R平方是Cox-Snell伪R平方的修正版本,由科恩(Nagelkerke)于1991年提出。其核心思想是将Cox-Snell伪R平方除以其可能达到的最大值,从而使整个指标的值域扩展至[0,1]的完整区间。其公式为:
当模型完美拟合时,Nagelkerke伪R平方取值为1;当模型完全不具有解释力时,取值为0。这一归一化处理使Nagelkerke伪R平方在直觉上比Cox-Snell版本更接近传统R平方的解读习惯。然而,归一化的代价是Nagelkerke伪R平方不再具有严格的统计基础——它是对Cox-Snell指标的一种经验性校正,而非源于某种似然理论的直接推导。因此,Nagelkerke伪R平方虽然在许多统计软件中作为默认的伪R平方之一广泛输出,但在严格的学术报告中,研究者通常建议辅以其他拟合优度指标。
Efron伪R平方
Efron伪R平方由布拉德利·埃夫龙(Bradley Efron)提出,是少数几种基于残差而非似然值的伪R平方。对于逻辑回归,其定义为:
其中为二元因变量(取值为0或1),为模型预测的概率值,为样本中因变量的均值。Efron伪R平方的数学形式与传统R平方几乎一致,唯一的区别在于用预测概率替代了线性预测值。其直观含义是:模型预测的概率与真实观测之间的平方误差相较于仅用均值预测的误差减少了多少比例。Efron伪R平方的优点是计算简单且易于解释,但其在极端分布情况下可能产生不合理的值——例如当大部分观测的而模型预测概率普遍较低时,该指标可能低估模型的真实判别能力。
计数伪R平方
计数伪R平方(Count R-squared)是在分类预测中最直观的一类伪R平方,定义为模型正确分类的观测比例:
该指标虽然计算极其简单且解读直观,但存在严重的缺陷——当因变量的类别分布高度不平衡时(例如患病率为5\%的罕见病数据),模型只需将所有观测预测为"健康"即可获得95\%的计数伪R平方,但这样的模型实际上毫无预测价值。为了弥补这一不足,研究者通常使用调整后的计数伪R平方(Adjusted Count R-squared),其将基准正确率设为零模型(仅根据优势类别进行预测)的正确率:
调整后的指标更真实地反映了模型相较于朴素基准的实际增益。
伪R平方的共性与局限
所有伪R平方指标都具有一个共同特征:它们并非像传统R平方那样表示方差解释比例,而是在相对意义上衡量模型相较于基准模型(通常是仅含截距项的零模型)的改进程度。因此,伪R平方的绝对值通常远低于线性回归中的R平方——一个McFadden伪R平方为0.3的模型在离散选择分析中已属非常出色的拟合,这与线性回归中R平方为0.3的含义截然不同。这一差异导致不了解该领域的研究者极易对伪R平方数值产生误读。
此外,伪R平方的不同指标之间往往数值差异显著,甚至在同一模型上得出的排名都可能不同。因此,学术研究中的规范做法是同时报告至少两种伪R平方(如McFadden伪R平方和Nagelkerke伪R平方),并参考信息准则(AIC、BIC)、混淆矩阵和ROC曲线下面积(AUC)等多元拟合指标进行综合判断。伪R平方虽然提供了一种将非线性模型的拟合程度量化的便捷途径,但它始终是线性回归中决定系数的一种近似替代,而非严格等价。
总结
伪R平方是在广义线性模型框架下衡量拟合优度的一类重要统计工具。McFadden伪R平方基于似然比原理,在离散选择模型中最受推崇;Cox-Snell伪R平方在线性模型特例下退化为传统R平方但存在上界缺陷;Nagelkerke伪R平方通过归一化修复了上界问题但牺牲了理论纯度;Efron伪R平方则回归到残差平方和的直观思路。在实际应用中,研究者应当理解每种伪R平方的构造逻辑、统计含义和局限,避免将其与经典R平方直接类比,并结合多种拟合诊断指标对模型质量做出全面评估。选择何种伪R平方,最终取决于研究问题的性质、模型类型以及所属学科的报告惯例。