ARTICLE
数据包络分析
数据包络分析 (Data Envelopment Analysis, DEA) 数据包络分析(Data Envelopment Analysis,简称 DEA)是一种基于线性规划的非参数效率评价方法,用于评估一组具有多投入、多产出特征的决策单元(Decision Making Units,DMU)之间的相对效率。该方法由 Charnes、Cooper 和 R
数据包络分析 (Data Envelopment Analysis, DEA)
数据包络分析(Data Envelopment Analysis,简称 DEA)是一种基于线性规划的非参数效率评价方法,用于评估一组具有多投入、多产出特征的决策单元(Decision Making Units,DMU)之间的相对效率。该方法由 Charnes、Cooper 和 Rhodes 于 1978 年在运筹学框架下首次提出,其核心思想是:以观测到的投入—产出数据为基础,构造一个分段线性的生产前沿面(Production Frontier),凡落在前沿面上的决策单元被视为有效率,而偏离前沿面的单元则存在不同程度的无效率。
与传统的随机前沿分析(Stochastic Frontier Analysis, SFA)不同,DEA 不需要预先设定生产函数的具体形式,也不需要对误差项的概率分布做出假设,因此属于典型的非参数方法。这一特性使 DEA 在处理多产出情形时具有天然优势——无需通过价格信息将多产出汇总为单一产出指标,而是直接处理多维投入-产出向量。
基本模型
一、CCR 模型(规模报酬不变)
Charnes、Cooper 和 Rhodes 提出的 CCR 模型假设所有 DMU 均处于规模报酬不变(Constant Returns to Scale, CRS)的生产阶段。对于第 个待评价决策单元,其技术效率(Technical Efficiency)可通过求解如下线性规划获得。设有 个 DMU,每个 DMU 使用 种投入 生产 种产出 ,则 DMU 的效率值 由以下输入导向型(Input-Oriented)乘数形式给出:
约束条件:
其中 和 分别为投入和产出的权重。若最优目标值等于 1,则 DMU 为 DEA 有效;若小于 1,则为 DEA 无效,其效率值即为 。
二、BCC 模型(规模报酬可变)
Banker、Charnes 和 Cooper 于 1984 年将 CCR 模型扩展为 BCC 模型,引入规模报酬可变(Variable Returns to Scale, VRS)的假设。BCC 模型在 CCR 模型的约束中增加凸性条件 (在包络形式中),从而将 CCR 的综合技术效率(Technical Efficiency, TE)分解为两个部分的乘积:
其中,TE 为纯技术效率(Pure Technical Efficiency),反映管理或技术水平导致的无效率;SE 为规模效率(Scale Efficiency),反映 DMU 是否在最优规模上运营。规模效率 SE 等于 1 时表明 DMU 处于最优生产规模(Most Productive Scale Size, MPSS),小于 1 则表明存在规模无效率——可能处于规模报酬递增或递减阶段。
导向选择与对偶形式
DEA 模型按导向分为两种基本类型。投入导向(Input-Oriented)在保持产出不变的前提下,寻求投入的最大比例缩减,回答"在现有产出水平下,投入最多可以减少多少"。产出导向(Output-Oriented)则保持投入不变,寻求产出的最大比例扩张,回答"在现有投入水平下,产出最多可以增加多少"。在 CCR 模型下,两种导向得到的效率值是倒数关系;在 BCC 模型下则未必。选择何种导向取决于决策者对投入或产出的控制能力——若投入要素可灵活调整而产出受外部约束(如公共部门的服务需求),多选用投入导向;反之亦然。
上述乘数形式可通过对偶理论转化为包络形式(Envelopment Form),后者在计算上更为常用。以投入导向型 CCR 模型为例,其包络形式为:
其中 为权重变量,当 时即为 BCC 模型。包络形式的经济学直觉清晰:它试图寻找一个由有效率 DMU 加权组合成的"虚拟 DMU",该虚拟 DMU 使用不多于 DMU 的投入,却产出不少于 DMU 的产出。 即为投入可同比例缩减的最大幅度。
应用领域与实例
DEA 自诞生以来已在众多领域获得广泛应用。在银行业,研究者以固定资产、员工人数、存款总额为投入,以贷款总额、非利息收入为产出,评估银行分支机构的运营效率。在医疗卫生领域,以病床数、医护人员配置为投入,以门诊量、手术例数、治愈率为产出,比较不同医院的资源利用效率。在教育评价中,以教师数、教学经费为投入,以毕业生人数、科研发表为产出,衡量高校院系的相对绩效。在农业经济、能源效率、供应链管理和公共政策评估等方向,DEA 同样展现出强大的适用性。
以三家同类型医院为例:A 医院投入 100 张床位、200 名医护人员,产出年门诊量 50,000 人次、手术 3,000 例;B 医院投入 120 张床位、220 名医护人员,产出门诊 55,000 人次、手术 3,500 例;C 医院投入 80 张床位、180 名医护人员,产出门诊 45,000 人次、手术 2,800 例。DEA 计算后可能发现 B 医院和 C 医院共同构成前沿面(效率值为 1),而 A 医院的投入中有 10\% 未有效转化为产出,效率值为 0.9。
扩展模型与前沿方向
DEA 方法论持续演进,衍生出多种重要扩展。超效率模型(Super-Efficiency DEA)允许有效率的 DMU 获得大于 1 的效率评分,从而在有效率单元之间进一步排序,避免传统模型无法区分多个有效率 DMU 的局限。交叉效率评价(Cross-Efficiency)通过引入"同行评价"机制——每个 DMU 不仅以自身最优权重评价,还接受其他 DMU 最优权重下的效率评分,克服了传统 DEA 权重过于灵活、DMU 可能在非关键维度赋零权重以抬高自身效率的问题。
Malmquist 指数是 DEA 在面板数据分析中的重要延伸,它将 DMU 在不同时期的效率变化分解为效率变化指数(Efficiency Change,追赶效应)和技术进步指数(Technical Change,前沿面移动效应):
其中 和 分别为第 期和第 期的距离函数。Malmquist 指数大于 1 表示全要素生产率提升,小于 1 则表示退步。该方法在宏观经济增长源泉分析、行业生产率比较等领域有重要应用价值。
此外,网络 DEA(Network DEA)将 DMU 内部结构打开,通过串联或并联的子过程刻画多阶段的效率传导机制,适用于供应链效率分析等场景。动态 DEA(Dynamic DEA)引入跨期结转变量以刻画投资或存货的动态效应。方向距离函数(Directional Distance Function)能够灵活设定投入缩减与产出扩张的方向,特别适用于包含非期望产出(如污染排放)的环境效率评价。
优势、局限与使用建议
DEA 的主要优势包括:(1)无需预设生产函数形式,避免函数形式误设导致的偏误;(2)天然处理多投入多产出,不需要价格信息进行加权汇总;(3)不仅给出效率评分,还能通过松弛变量分析识别每个无效率 DMU 的具体改进方向与幅度;(4)权重由数据内生决定,避免主观赋权的争议。
其主要局限有:(1)对极端值和测量误差敏感,少数异常点可能显著改变前沿面的位置,导致其他 DMU 的效率被系统性低估或高估——通常建议结合稳健性检验(如 Jackknife 或 Bootstrap DEA)审慎使用;(2)当 DMU 数量相对于投入产出维度较少时,多数 DMU 可能被评价为有效率,丧失区分能力——经验法则是 DMU 数量应不少于投入产出变量总数的三倍;(3)DEA 测定的是相对效率而非绝对效率,即便所有 DMU 实际表现不佳,DEA 也会将其中表现最好的单元评为有效率;(4)传统 DEA 未考虑随机噪声,将所有偏离前沿面的部分归因于无效率,这在数据噪声较大的场景中可能高估无效率程度。
在实践中,研究者应根据数据特征和问题背景,在 DEA 与随机前沿分析等参数方法之间审慎选择。对于大样本、多产出且对生产函数形式缺乏先验知识的效率评价任务,DEA 是一种功能强大且适用性广泛的工具。