随机效应 (Random Effects)
随机效应模型(Random Effects Model, RE)是面板数据分析中的核心方法之一,与固定效应模型并列构成处理面板数据中个体异质性的两大基本策略。随机效应模型的核心假设是个体特定的截距项 αi 是一个随机变量,与模型中的解释变量不相关,即 Cov(αi,xit)=0。该模型将个体异质性视为误差项的一部分,而非需要估计的固定参数,从而在特定条件下比固定效应估计更有效。
模型设定
标准随机效应模型的形式为:
yit=xit′β+αi+ϵit,i=1,…,N,t=1,…,T
其中 αi∼i.i.d.(0,σα2) 是个体特定的随机效应,ϵit∼i.i.d.(0,σϵ2) 是特异性误差,两者相互独立。定义复合误差项 uit=αi+ϵit,其方差-协方差矩阵具有特定结构:同一观测个体不同时期的复合误差存在相关性 Corr(uit,uis)=σα2/(σα2+σϵ2)(对任意 t=s),而不同个体间的误差相互独立。
估计方法
随机效应模型不能直接用普通最小二乘法(OLS)进行估计,因为复合误差项内的序列相关性违反了OLS的同方差性假设,导致OLS虽然仍保持一致性,但不再是BLUE。标准估计方法为广义最小二乘法(GLS)或可行广义最小二乘法(FGLS),通过准差分变换消除误差的自相关结构:
yit−θyˉi=(xit−θxˉi)′β+(uit−θuˉi)
其中 θ=1−σϵ/σϵ2+Tσα2 是准差分因子。在 θ=0 的极限情况下RE退化为OLS;在 θ=1 的极限情况下RE退化为固定效应模型。实际应用中,方差分量 σα2 和 σϵ2 需要先从数据中估计得到。
与固定效应模型的选择
随机效应与固定效应的选择是面板数据分析中的核心决策问题。随机效应的优势在于估计更加有效,且允许包含不随时间变化的解释变量(如性别、种族等),而固定效应模型会消除这些变量。然而随机效应的关键假设 Cov(αi,xit)=0 在实践中往往不成立,若该假设被违反则RE估计量将是有偏且不一致的。
选择标准通常通过豪斯曼检验(Hausman Test)进行:原假设为个体效应与解释变量不相关(即RE一致且有效),在原假设下RE与FE的估计量都应一致但RE更有效;若拒绝原假设,表明RE不一致,应选用固定效应模型。检验统计量为:
H=(β^FE−β^RE)′[Var(β^FE)−Var(β^RE)]−1(β^FE−β^RE)dχ2(K)
随机效应模型在劳动经济学、教育经济学和健康经济学等需要对不随时间变化的个体特征进行推断的领域中应用广泛,其估计效率的优势在大N小T的面板数据中尤为明显。