ARTICLE

面板数据

面板数据 (Panel Data) 面板数据(纵贯数据)是计量经济学中同时包含横截面数据和时间序列数据维度的数据结构。表示为对个体 i = 1, , N 在时间 t = 1, , T 的观测 \X_it\。分为平衡面板(每个体完整观测)和非平衡面板(不同个体观测长度不同)。 面板数据的优势 控制不可观测的个体异质性(最核心优势):控制不随时间变化的个体特征(

浏览 79 更新 2025-10-26

面板数据 (Panel Data)

面板数据(纵贯数据)是计量经济学中同时包含横截面数据时间序列数据维度的数据结构。表示为对个体 i=1,,Ni = 1, \dots, N 在时间 t=1,,Tt = 1, \dots, T 的观测 {Xit}\{X_{it}\}。分为平衡面板(每个体完整观测)和非平衡面板(不同个体观测长度不同)。

面板数据的优势

  1. 控制不可观测的个体异质性(最核心优势):控制不随时间变化的个体特征(能力、管理文化、制度),消除遗漏变量偏误
  2. 更丰富的信息:结合个体间和个体内变异,增大样本量(N×TN \times T),提高自由度,减少多重共线性
  3. 研究动态调整过程:追踪同一体的时间变化,分析状态依赖

基础面板数据模型

模型:yit=β0+xitβ+uity_{it} = \beta_0 + \mathbf{x}_{it}'\boldsymbol{\beta} + u_{it}

混合回归模型:忽略面板结构直接OLS,要求误差项与解释变量在所有维度不相关且无个体未观测因素——现实极少成立。

固定效应模型 (FE)yit=xitβ+αi+ϵity_{it} = \mathbf{x}_{it}'\boldsymbol{\beta} + \alpha_i + \epsilon_{it}αi\alpha_i 为个体固定效应(允许与 xit\mathbf{x}_{it} 相关)。通过组内离差变换(减个体均值)消除 αi\alpha_i(yityˉi)=(xitxˉi)β+(ϵitϵˉi)(y_{it} - \bar{y}_i) = (\mathbf{x}_{it} - \bar{\mathbf{x}}_i)'\boldsymbol{\beta} + (\epsilon_{it} - \bar{\epsilon}_i)。优点:即使 αi\alpha_ixit\mathbf{x}_{it} 相关也可一致估计;缺点:无法估计不随时间变化的变量系数。

随机效应模型 (RE):假设个体效应 αi\alpha_i 与解释变量不相关(Cov(xit,αi)=0\mathrm{Cov}(\mathbf{x}_{it}, \alpha_i) = 0)。因同一体不同时期含共同 αi\alpha_i 导致序列相关,需用广义最小二乘法(GLS)。优点:若假设成立比FE更有效,可估计不随时间变化系数;缺点:假设很强,被违背则有偏且不一致。

模型选择——豪斯曼检验 (Hausman Test)H0H_0为RE成立(Cov(xit,αi)=0\mathrm{Cov}(\mathbf{x}_{it}, \alpha_i) = 0)。拒绝H0H_0则应选FE,未拒绝可选RE(更有效)。

扩展

双向固定效应(同时控制个体和时间效应)、动态面板数据模型(含滞后因变量,需广义矩方法GMM/Arellano-Bond估计量处理内生性)、长面板(需考虑平稳性协整)。