ARTICLE

Levinsohn-Petrin方法

Levinsohn-Petrin 方法 Levinsohn-Petrin 方法(简称 LP 方法)是生产力估计领域中一种半参数估计技术,由 James Levinsohn 和 Amil Petrin 于 2003 年在《Review of Economic Studies》上发表的开创性论文《Estimating Production Functions U

浏览 5 更新 2025-12-19

Levinsohn-Petrin 方法

Levinsohn-Petrin 方法(简称 LP 方法)是生产力估计领域中一种半参数估计技术,由 James Levinsohn 和 Amil Petrin 于 2003 年在《Review of Economic Studies》上发表的开创性论文《Estimating Production Functions Using Inputs to Control for Unobservables》中正式提出。该方法旨在解决生产函数估计中的内生性问题——即企业能观察到自身生产率冲击并据此调整要素投入,而计量经济学家无法观测到这些冲击,从而导致传统 OLS 估计产生偏误。LP 方法以中间投入品(如原材料、能源)作为不可观测生产率的代理变量,克服了 Olley-Pakes(1996)方法中使用投资作为代理变量所面临的零投资截断问题,成为实证产业组织与生产率研究中最广泛使用的估计框架之一。

背景与核心问题

在估计 Cobb-Douglas 或超越对数形式的生产函数时,计量经济学家面临一个根本性难题:同时性偏误(simultaneity bias)。设生产函数为:

yit=β0+βllit+βkkit+ωit+ηity_{it} = \beta_0 + \beta_l l_{it} + \beta_k k_{it} + \omega_{it} + \eta_{it}

其中 yity_{it} 为对数产出,litl_{it} 为对数劳动投入,kitk_{it} 为对数资本投入,ωit\omega_{it} 为不可观测的生产率冲击(企业可观察到),ηit\eta_{it} 为纯粹的随机误差项。由于企业在观察到 ωit\omega_{it} 后决定劳动和中间投入品的用量,存在 Cov(lit,ωit)0\text{Cov}(l_{it}, \omega_{it}) \neq 0,OLS 估计量将是有偏且不一致的。工具变量法在微观企业面板数据中往往面临弱工具变量问题,固定效应模型则要求生产率不随时间变化的苛刻假设。

Marschak 和 Andrews(1944)最早识别了这一问题,但直到 Olley 和 Pakes(1996)才提出了一个可行的半参数解决方案。LP 方法在 OP 方法的基础上做出了关键改进,使估计在实践上更为稳健和广泛应用。

核心思想与理论机制

LP 方法的核心创新在于用中间投入品替代投资作为生产率的代理变量

在 Olley-Pakes 框架中,投资需求函数为 iit=it(kit,ωit)i_{it} = i_t(k_{it}, \omega_{it}),通过对其求逆得到 ωit=ht(kit,iit)\omega_{it} = h_t(k_{it}, i_{it})。但这一策略存在两个重要局限:(1)投资具有不可逆性调整成本,导致许多企业在某些年份的观察值为零,OP 方法的严格单调性条件要求 iit>0i_{it} > 0,因此零投资观测必须被截断丢弃,造成样本选择性偏误;(2)投资对生产率冲击的反应可能滞后且不完全,削弱了反函数中生产率信息提取的有效性。

LP 方法假设中间投入需求函数为:

mit=mt(kit,ωit)m_{it} = m_t(k_{it}, \omega_{it})

中间投入品(如电力、原材料、燃料)具有三个关键优势:(1)几乎不存在零值问题——企业只要生产就必须使用中间投入品;(2)调整灵活——中间投入品的调整成本远低于资本投资,因此对当期生产率冲击的反应更为及时和充分;(3)在大多数企业调查数据中,中间投入品数据比投资数据更完整、质量更高。

在标准假设下,中间投入需求函数关于 ωit\omega_{it} 严格单调递增(给定资本存量,生产率越高的企业使用的中间投入品越多),因此可以求逆得到:

ωit=mt1(kit,mit)gt(kit,mit)\omega_{it} = m_t^{-1}(k_{it}, m_{it}) \equiv g_t(k_{it}, m_{it})

两阶段估计程序

LP 方法的估计分为两个阶段,与 OP 方法结构类似。

第一阶段

将不可观测生产率 ωit\omega_{it} 替换为其代理函数 gt(kit,mit)g_t(k_{it}, m_{it}),生产函数变为:

yit=βllit+ϕt(kit,mit)+ηity_{it} = \beta_l l_{it} + \phi_t(k_{it}, m_{it}) + \eta_{it}

其中 ϕt(kit,mit)β0+βkkit+gt(kit,mit)\phi_t(k_{it}, m_{it}) \equiv \beta_0 + \beta_k k_{it} + g_t(k_{it}, m_{it})。由于 ϕt()\phi_t(\cdot) 的函数形式未知,使用资本和中间投入品的高阶多项式(如三阶多项式及其交乘项)来近似,然后通过 OLS 获得劳动系数 βl\beta_l 的一致估计量以及 ϕt\phi_t 的拟合值 ϕ^it\hat{\phi}_{it}

这里的一个关键识别假设是:劳动投入在当期是可变要素,可能在中间投入品决定之前确定(从而与中间投入品选择无关),也可能同时确定。LP 的基准设定假设劳动与中间投入品同时被选择,在此情况下第一阶段只能识别 βl\beta_l,而不能分别识别 βk\beta_k

第二阶段

第二阶段的识别依赖于关于生产率演进的马尔可夫假设:

ωit=E[ωitωi,t1]+ξit=f(ωi,t1)+ξit\omega_{it} = E[\omega_{it} \mid \omega_{i,t-1}] + \xi_{it} = f(\omega_{i,t-1}) + \xi_{it}

其中 ξit\xi_{it} 是创新项,与 t1t-1 期的信息集(包括 kitk_{it},因为资本在 t1t-1 期决定)正交。这给出矩条件:

E[ξitkit]=0E[\xi_{it} \mid k_{it}] = 0

对于任意候选的 βk\beta_k,计算隐含的生产率:

ω^it(βk)=ϕ^itβkkit\hat{\omega}_{it}(\beta_k) = \hat{\phi}_{it} - \beta_k k_{it}

ω^it\hat{\omega}_{it} 对其滞后项做非参数回归(如局部线性回归或核回归)得到 f()f(\cdot),残差即为 ξ^it\hat{\xi}_{it}。然后利用样本矩条件搜索使 ξ^it\hat{\xi}_{it}kitk_{it} 正交的 βk\beta_k 值,通常通过非线性最小二乘或 GMM 实现。获得 βk\beta_k 后,即可计算各企业的全要素生产率(TFP)估计值。

与 Olley-Pakes 方法的比较

  • 代理变量:Olley-Pakes 使用投资 iiti_{it};Levinsohn-Petrin 使用中间投入品 mitm_{it}
  • 零值问题:OP 方法严重——零投资观测被截断;LP 方法几乎不存在。
  • 数据可用性:投资数据常缺失或不可靠;中间投入品数据通常可得。
  • 单调性假设iiti_{it} 关于 ωit\omega_{it} 单调;mitm_{it} 关于 ωit\omega_{it} 单调。
  • 样本损失:OP 可能损失 20\%--50\%;LP 基本无损失。
  • 调整灵活性:投资存在调整成本与不可逆性;中间投入品调整高度灵活。

实证研究表明,在某些情境下 LP 与 OP 估计结果相近,但当零投资比例较高时,LP 方法因保留更多样本而显著降低了估计方差,且减少了选择偏误。

扩展与批评

Ackerberg-Caves-Frazer(ACF)批判

Ackerberg、Caves 和 Frazer(2015)指出 LP(以及 OP)的第一阶段估计可能面临函数依赖问题(functional dependence problem)。如果劳动 litl_{it} 也被假定为 kitk_{it}ωit\omega_{it} 的函数,且中间投入品需求函数同样依赖于 kitk_{it}ωit\omega_{it},那么在第一阶段回归中,劳动变量将是资本和中间投入品的确定性函数,导致 βl\beta_l 无法被识别。ACF 建议将所有系数放在第二阶段通过额外矩条件联合估计。这一批评催生了在 LP/OP 与 ACF 之间关于时序假设(timing assumptions)的深入讨论:劳动究竟是在中间投入品选择之前、同时还是之后决定的?

Wooldridge 联合估计

Wooldridge(2009)提出了一种基于 GMM 的联合估计框架,将两阶段矩条件合并为一组同时求解的矩条件方程组。该方法在效率上优于两步法(考虑了跨期相关性),且能自动产生正确的标准误,避免了传统两步法的标准误校正问题。Wooldridge 的框架已成为现代生产力估计的基准方法之一。

其他扩展

  • 多产品企业:De Loecker(2011)将 LP 框架扩展至多产品企业,通过引入产品层面的投入分配和需求侧信息识别各产品的生产率差异。
  • 内生退出:OP 方法包含了企业退出校正项,LP 原始版本未予考虑,但后续研究(如 Olley 和 Pakes 的扩展应用)可通过引入生存概率校正来纳入退出偏误。
  • 价格偏误:当使用收入而非实物产出时,不可观测的价格差异会污染生产率估计。De Loecker 等学者通过需求系统估计进行校正。

实际应用中的注意事项

在实践中应用 LP 方法时,研究者需关注以下要点:

  1. 函数形式:一阶多项式的阶数选择(通常三阶或四阶)以及交乘项的范围会影响拟合效果。建议进行稳健性检验。
  2. 标准误:由于第二阶段使用第一阶段生成的回归元,传统标准误是不一致的。必须使用自助法(bootstrap)或解析校正方法。
  3. 中间投入品的度量:不同中间投入品(原材料、能源、服务性投入)对生产率冲击的敏感度各异。通常选用原材料和能源的合计作为代理变量表现最佳。
  4. 行业异质性:LP 假设对于所有行业中间投入品需求函数的单调性均成立,但在某些服务业或采掘业中,该假设可能存疑。
  5. 软件实现:主流实现包括 Stata 的 \texttt{levpet} 命令、R 的 \texttt{prodest} 包以及 Python 的自定义实现。

影响与地位

Levinsohn-Petrin 方法自发表以来,已成为实证产业组织和国际贸易领域中估计企业层面全要素生产率的标准工具。截至 2024 年,原始论文的 Google Scholar 引用量已超过 12,000 次,广泛覆盖生产率分解、贸易自由化效应评估、资源配置效率分析、创新政策评价等研究领域。LP 方法与 Melitz(2003)的异质性企业贸易理论相结合,为理解企业层面生产率差异与贸易参与决策之间的互动提供了关键的计量基础。

参考文献

  • Levinsohn, J., \& Petrin, A. (2003). Estimating Production Functions Using Inputs to Control for Unobservables. Review of Economic Studies, 70(2), 317--341.
  • Olley, G. S., \& Pakes, A. (1996). The Dynamics of Productivity in the Telecommunications Equipment Industry. Econometrica, 64(6), 1263--1297.
  • Ackerberg, D. A., Caves, K., \& Frazer, G. (2015). Identification Properties of Recent Production Function Estimators. Econometrica, 83(6), 2411--2451.
  • Wooldridge, J. M. (2009). On Estimating Firm-Level Production Functions Using Proxy Variables to Control for Unobservables. Economics Letters, 104(3), 112--114.
  • De Loecker, J. (2011). Product Differentiation, Multiproduct Firms, and Estimating the Impact of Trade Liberalization on Productivity. Econometrica, 79(5), 1407--1451.
  • Marschak, J., \& Andrews, W. H. (1944). Random Simultaneous Equations and the Theory of Production. Econometrica, 12(3/4), 143--205.
  • Melitz, M. J. (2003). The Impact of Trade on Intra-Industry Reallocations and Aggregate Industry Productivity. Econometrica, 71(6), 1695--1725.