ARTICLE

数据包络分析

数据包络分析 (Data Envelopment Analysis, DEA) 数据包络分析（Data Envelopment Analysis，简称 DEA）是一种基于线性规划的非参数效率评价方法，用于评估一组具有多投入、多产出特征的决策单元（Decision Making Units，DMU）之间的相对效率。该方法由 Charnes、Cooper 和 R

浏览 0 更新 2025-01-21

数据包络分析 (Data Envelopment Analysis, DEA)

数据包络分析（Data Envelopment Analysis，简称 DEA）是一种基于线性规划的非参数效率评价方法，用于评估一组具有多投入、多产出特征的决策单元（Decision Making Units，DMU）之间的相对效率。该方法由 Charnes、Cooper 和 Rhodes 于 1978 年在运筹学框架下首次提出，其核心思想是：以观测到的投入—产出数据为基础，构造一个分段线性的生产前沿面（Production Frontier），凡落在前沿面上的决策单元被视为有效率，而偏离前沿面的单元则存在不同程度的无效率。

与传统的随机前沿分析（Stochastic Frontier Analysis, SFA）不同，DEA 不需要预先设定生产函数的具体形式，也不需要对误差项的概率分布做出假设，因此属于典型的非参数方法。这一特性使 DEA 在处理多产出情形时具有天然优势——无需通过价格信息将多产出汇总为单一产出指标，而是直接处理多维投入-产出向量。

基本模型

一、CCR 模型（规模报酬不变）

Charnes、Cooper 和 Rhodes 提出的 CCR 模型假设所有 DMU 均处于规模报酬不变（Constant Returns to Scale, CRS）的生产阶段。对于第 $k$ 个待评价决策单元，其技术效率（Technical Efficiency）可通过求解如下线性规划获得。设有 $n$ 个 DMU，每个 DMU 使用 $m$ 种投入 $x_{ij}$ 生产 $s$ 种产出 $y_{rj}$ ，则 DMU $_{k}$ 的效率值 $\theta_{k}$ 由以下输入导向型（Input-Oriented）乘数形式给出：

\max \quad \sum_{r=1}^{s} u_{r} y_{rk}

约束条件：

\begin{align} \[ \sum_{r=1}^{s} u_{r} y_{rj} - \sum_{i=1}^{m} v_{i} x_{ij} &\leq 0, \quad j = 1, 2, \ldots, n \\ \] \[ \sum_{i=1}^{m} v_{i} x_{ik} &= 1 \\ \] \[ u_{r}, v_{i} &\geq 0 \] \end{align}

其中 $v_{i}$ 和 $u_{r}$ 分别为投入和产出的权重。若最优目标值等于 1，则 DMU $_{k}$ 为 DEA 有效；若小于 1，则为 DEA 无效，其效率值即为 $\theta_{k}$ 。

二、BCC 模型（规模报酬可变）

Banker、Charnes 和 Cooper 于 1984 年将 CCR 模型扩展为 BCC 模型，引入规模报酬可变（Variable Returns to Scale, VRS）的假设。BCC 模型在 CCR 模型的约束中增加凸性条件 $\sum_{j=1}^{n} \lambda_{j} = 1$ （在包络形式中），从而将 CCR 的综合技术效率（Technical Efficiency, TE）分解为两个部分的乘积：

\text{TE}_{\text{CRS}} = \text{TE}_{\text{VRS}} \times \text{SE}

其中，TE $_{\text{VRS}}$ 为纯技术效率（Pure Technical Efficiency），反映管理或技术水平导致的无效率；SE 为规模效率（Scale Efficiency），反映 DMU 是否在最优规模上运营。规模效率 SE 等于 1 时表明 DMU 处于最优生产规模（Most Productive Scale Size, MPSS），小于 1 则表明存在规模无效率——可能处于规模报酬递增或递减阶段。

导向选择与对偶形式

DEA 模型按导向分为两种基本类型。投入导向（Input-Oriented）在保持产出不变的前提下，寻求投入的最大比例缩减，回答"在现有产出水平下，投入最多可以减少多少"。产出导向（Output-Oriented）则保持投入不变，寻求产出的最大比例扩张，回答"在现有投入水平下，产出最多可以增加多少"。在 CCR 模型下，两种导向得到的效率值是倒数关系；在 BCC 模型下则未必。选择何种导向取决于决策者对投入或产出的控制能力——若投入要素可灵活调整而产出受外部约束（如公共部门的服务需求），多选用投入导向；反之亦然。

上述乘数形式可通过对偶理论转化为包络形式（Envelopment Form），后者在计算上更为常用。以投入导向型 CCR 模型为例，其包络形式为：

\min \quad \theta_{k}

\text{s.t.} \quad \sum_{j=1}^{n} \lambda_{j} x_{ij} \leq \theta_{k} x_{ik}, \quad i = 1,\ldots,m

\sum_{j=1}^{n} \lambda_{j} y_{rj} \geq y_{rk}, \quad r = 1,\ldots,s

\lambda_{j} \geq 0, \quad j = 1,\ldots,n

其中 $\lambda_{j}$ 为权重变量，当 $\sum \lambda_{j} = 1$ 时即为 BCC 模型。包络形式的经济学直觉清晰：它试图寻找一个由有效率 DMU 加权组合成的"虚拟 DMU"，该虚拟 DMU 使用不多于 DMU $_{k}$ 的投入，却产出不少于 DMU $_{k}$ 的产出。 $\theta_{k}$ 即为投入可同比例缩减的最大幅度。

应用领域与实例

DEA 自诞生以来已在众多领域获得广泛应用。在银行业，研究者以固定资产、员工人数、存款总额为投入，以贷款总额、非利息收入为产出，评估银行分支机构的运营效率。在医疗卫生领域，以病床数、医护人员配置为投入，以门诊量、手术例数、治愈率为产出，比较不同医院的资源利用效率。在教育评价中，以教师数、教学经费为投入，以毕业生人数、科研发表为产出，衡量高校院系的相对绩效。在农业经济、能源效率、供应链管理和公共政策评估等方向，DEA 同样展现出强大的适用性。

以三家同类型医院为例：A 医院投入 100 张床位、200 名医护人员，产出年门诊量 50,000 人次、手术 3,000 例；B 医院投入 120 张床位、220 名医护人员，产出门诊 55,000 人次、手术 3,500 例；C 医院投入 80 张床位、180 名医护人员，产出门诊 45,000 人次、手术 2,800 例。DEA 计算后可能发现 B 医院和 C 医院共同构成前沿面（效率值为 1），而 A 医院的投入中有 10\% 未有效转化为产出，效率值为 0.9。

扩展模型与前沿方向

DEA 方法论持续演进，衍生出多种重要扩展。超效率模型（Super-Efficiency DEA）允许有效率的 DMU 获得大于 1 的效率评分，从而在有效率单元之间进一步排序，避免传统模型无法区分多个有效率 DMU 的局限。交叉效率评价（Cross-Efficiency）通过引入"同行评价"机制——每个 DMU 不仅以自身最优权重评价，还接受其他 DMU 最优权重下的效率评分，克服了传统 DEA 权重过于灵活、DMU 可能在非关键维度赋零权重以抬高自身效率的问题。

Malmquist 指数是 DEA 在面板数据分析中的重要延伸，它将 DMU 在不同时期的效率变化分解为效率变化指数（Efficiency Change，追赶效应）和技术进步指数（Technical Change，前沿面移动效应）：

M = \left[ \frac{D^{t}(x^{t+1}, y^{t+1})}{D^{t}(x^{t}, y^{t})} \times \frac{D^{t+1}(x^{t+1}, y^{t+1})}{D^{t+1}(x^{t}, y^{t})} \right]^{1/2}

其中 $D^{t}$ 和 $D^{t+1}$ 分别为第 $t$ 期和第 $t+1$ 期的距离函数。Malmquist 指数大于 1 表示全要素生产率提升，小于 1 则表示退步。该方法在宏观经济增长源泉分析、行业生产率比较等领域有重要应用价值。

此外，网络 DEA（Network DEA）将 DMU 内部结构打开，通过串联或并联的子过程刻画多阶段的效率传导机制，适用于供应链效率分析等场景。动态 DEA（Dynamic DEA）引入跨期结转变量以刻画投资或存货的动态效应。方向距离函数（Directional Distance Function）能够灵活设定投入缩减与产出扩张的方向，特别适用于包含非期望产出（如污染排放）的环境效率评价。

优势、局限与使用建议

DEA 的主要优势包括：（1）无需预设生产函数形式，避免函数形式误设导致的偏误；（2）天然处理多投入多产出，不需要价格信息进行加权汇总；（3）不仅给出效率评分，还能通过松弛变量分析识别每个无效率 DMU 的具体改进方向与幅度；（4）权重由数据内生决定，避免主观赋权的争议。

其主要局限有：（1）对极端值和测量误差敏感，少数异常点可能显著改变前沿面的位置，导致其他 DMU 的效率被系统性低估或高估——通常建议结合稳健性检验（如 Jackknife 或 Bootstrap DEA）审慎使用；（2）当 DMU 数量相对于投入产出维度较少时，多数 DMU 可能被评价为有效率，丧失区分能力——经验法则是 DMU 数量应不少于投入产出变量总数的三倍；（3）DEA 测定的是相对效率而非绝对效率，即便所有 DMU 实际表现不佳，DEA 也会将其中表现最好的单元评为有效率；（4）传统 DEA 未考虑随机噪声，将所有偏离前沿面的部分归因于无效率，这在数据噪声较大的场景中可能高估无效率程度。

在实践中，研究者应根据数据特征和问题背景，在 DEA 与随机前沿分析等参数方法之间审慎选择。对于大样本、多产出且对生产函数形式缺乏先验知识的效率评价任务，DEA 是一种功能强大且适用性广泛的工具。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。