ARTICLE

比例风险模型

比例风险模型 (Proportional Hazards Model) 比例风险模型由David Cox于1972年提出，是生存分析 (Survival Analysis)中应用最广泛的半参数回归模型。其核心思想是将个体的风险函数 (Hazard Function) 公式分解为两部分：仅依赖时间的基准风险 (Baseline Hazard) 公式和由协变

浏览 0 更新 2025-11-08

比例风险模型 (Proportional Hazards Model)

比例风险模型由David Cox于1972年提出，是生存分析 (Survival Analysis)中应用最广泛的半参数回归模型。其核心思想是将个体的风险函数 (Hazard Function) $h(t)$ 分解为两部分：仅依赖时间的基准风险 (Baseline Hazard) $h_0(t)$ 和由协变量线性组合决定的风险比率 (Hazard Ratio)：

h(t \mid X) = h_0(t) \cdot \exp(\beta_1 X_1 + \beta_2 X_2 + \cdots + \beta_k X_k)

其中 $X = (X_1, \ldots, X_k)$ 为协变量向量， $\beta$ 为待估参数。关键假设是比例风险假定 (Proportional Hazards Assumption)：任意两个个体的风险比 $\exp(\beta'(X_i - X_j))$ 不随时间变化，即协变量效应在整个观测期内保持恒定。这一假定是该模型的核心约束，需通过Schoenfeld残差检验或log-log生存曲线图进行诊断。

估计方法：偏似然

Cox模型最精巧之处在于偏似然估计 (Partial Likelihood Estimation)。由于基准风险 $h_0(t)$ 未指定具体形式，传统最大似然法不可行。Cox证明，可以在不对 $h_0(t)$ 做任何参数假设的前提下，仅利用事件发生时刻的风险集 (Risk Set)排序信息构造偏似然函数：

L(\beta) = \prod_{i: \delta_i = 1} \frac{\exp(\beta' X_i)}{\sum_{j \in R(t_i)} \exp(\beta' X_j)}

其中 $R(t_i)$ 为在时刻 $t_i$ 仍然"存活"（未发生事件、未删失）的所有个体集合， $\delta_i$ 为事件指示变量。偏似然最大化得到的 $\hat{\beta}$ 具有一致性和渐近正态性，且与完全似然估计相比仅损失少量效率。这一性质使Cox模型在实证研究中极为实用——研究者无需对基准风险分布（Weibull、Gompertz等）做出可能错误的假定。

经济学与金融学应用

在劳动经济学中，比例风险模型广泛用于分析失业持续时间 (Unemployment Duration)：协变量包括受教育年限、年龄、既往工资水平、失业保险金替代率等，风险函数刻画个体在已失业 $t$ 个月后于下一时刻找到工作的瞬时概率。关键发现之一是"负持续时间依赖"——失业时间越长，再就业风险越低，这与人力资本折旧和雇主信号甄别（统计歧视 (Statistical Discrimination)）理论一致。

在企业金融领域，Cox模型被用于建模企业破产或违约时间。协变量通常取自Altman Z-score等财务比率（杠杆率、流动比率、盈利能力等），以及宏观变量（GDP增速、信用利差）。相较于静态的logit/probit违约模型，Cox模型能利用右删失 (Right Censoring)数据中"尚未违约"企业的时间信息，估计效率更高。在信用风险 (Credit Risk)建模中，Shumway (2001)证明基于Cox模型的动态违约预测显著优于静态MDA和logit方法，这已成为学术共识。

在产业组织研究中，Cox模型被用于分析企业存活时间和市场退出决策，协变量涵盖企业规模、年龄（被动学习 (Passive Learning)效应）、全要素生产率、行业集中度和进入壁垒。此外，在健康经济学中，该模型用于评估医疗干预对患者生存时间的影响，以及在发展经济学中分析技术采纳时滞——农户从首次接触到实际采用新品种/新技术的持续时间。

扩展与局限

当比例风险假定不成立时，可采用分层Cox模型 (Stratified Cox Model)：对违反假定的分类变量分层，每层拥有独立的基准风险 $h_{0g}(t)$ ，但协变量的 $\beta$ 系数跨层共享。另一种策略是引入时变协变量 (Time-Varying Covariates) $X(t)$ ，允许解释变量值随时间更新（如逐年变化的杠杆率），此时模型变为：

h(t \mid X(t)) = h_0(t) \cdot \exp(\beta' X(t))

但需注意：时变协变量的引入模糊了"因果"解释——当 $X(t)$ 本身受过去生存状态影响时，内生性问题不可避免。

Cox模型的其他局限包括：无法直接估计基准生存函数（需借助Breslow或Kalbfleisch-Prentice方法）、对非比例风险的敏感性、以及处理竞争风险 (Competing Risks)时需借助Fine-Gray子分布风险模型或Cause-Specific Hazard模型。尽管存在这些限制，比例风险模型凭借其半参数灵活性、成熟的软件实现（R的\texttt{survival}包、Stata的\texttt{stcox}命令）和直观的风险比解释（ $\exp(\beta_k)$ 表示协变量 $X_k$ 每增加一单位带来的风险倍数变化），仍是持续时间分析中不可替代的基准工具。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。