ARTICLE

Prais-Winsten变换

Prais-Winsten变换 (Prais-Winsten Transformation) Prais-Winsten变换 (Prais-Winsten Transformation) 是计量经济学中用于处理自相关(序列相关)的一种估计方法,由苏珊·普雷斯 (Susan J. Prais) 和克里斯托弗·温斯顿 (Christopher B. Winste

浏览 0 更新 2025-11-10

Prais-Winsten变换 (Prais-Winsten Transformation)

Prais-Winsten变换 (Prais-Winsten Transformation) 是计量经济学中用于处理自相关(序列相关)的一种估计方法,由苏珊·普雷斯 (Susan J. Prais) 和克里斯托弗·温斯顿 (Christopher B. Winsten) 于1954年提出。该方法是广义最小二乘法 (GLS) 在一阶自回归模型 AR(1) 误差下的具体实现,与Cochrane-Orcutt迭代法高度相似,但关键区别在于对第一期观测值的处理方式:Prais-Winsten变换保留了第一期观测数据,从而在小样本中具有更优的统计性质。

模型设定

考虑标准的一阶自相关回归模型:

yt=xtβ+ut,t=1,2,,Ty_t = x_t^{\top} \beta + u_t, \quad t = 1, 2, \ldots, T

其中误差项 utu_t 服从一阶自回归过程 AR(1):

ut=ρut1+εt,ρ<1u_t = \rho u_{t-1} + \varepsilon_t, \quad |\rho| < 1

这里 εt\varepsilon_t白噪声过程,满足 E(εt)=0\mathbb{E}(\varepsilon_t) = 0Var(εt)=σ2\operatorname{Var}(\varepsilon_t) = \sigma^2,且 E(εtεs)=0\mathbb{E}(\varepsilon_t \varepsilon_s) = 0 对任意 tst \neq s 成立。参数 ρ\rho 为自相关系数,其绝对值小于1保证了过程的平稳性

在该设定下,误差项的协方差矩阵为:

\Omega = \sigma^2 \begin{pmatrix}

1 \& ρ\rho \& ρ2\rho^2 \& \cdots \& ρT1\rho^{T-1} \\ ρ\rho \& 1 \& ρ\rho \& \cdots \& ρT2\rho^{T-2} \\ ρ2\rho^2 \& ρ\rho \& 1 \& \cdots \& ρT3\rho^{T-3} \\ \vdots \& \vdots \& \vdots \& \ddots \& \vdots \\ ρT1\rho^{T-1} \& ρT2\rho^{T-2} \& ρT3\rho^{T-3} \& \cdots \& 1

\end{pmatrix}

由于 Ωσ2IT \Omega \neq \sigma^2 I_T 普通最小二乘法 (OLS) 虽然仍保持无偏性一致性,但不再具有有效性(即不再是最小方差估计量),且标准误估计量通常被低估,导致t检验F检验的推断失真。

变换原理

Prais-Winsten变换的核心思想是通过一个线性变换 PP 将原始模型转化为满足球形扰动项 (Spherical Disturbance) 假设的模型,使得变换后的误差项满足同方差性无自相关性

具体而言,变换矩阵 PP 满足 PP=Ω1P^{\top} P = \Omega^{-1}。对于 AR(1) 误差结构,PP 可以显式构造如下:

对于第一期观测值 (t=1)(t = 1)

1ρ2y1=1ρ2x1β+1ρ2u1\sqrt{1 - \rho^2} \, y_1 = \sqrt{1 - \rho^2} \, x_1^{\top} \beta + \sqrt{1 - \rho^2} \, u_1

注意 u1u_1 的方差为 Var(u1)=σ2/(1ρ2)\operatorname{Var}(u_1) = \sigma^2 / (1 - \rho^2),因此变换后误差项的方差为 σ2\sigma^2

对于其余各期 (t2)(t \geq 2)

ytρyt1=(xtρxt1)β+(utρut1)=(xtρxt1)β+εty_t - \rho y_{t-1} = (x_t - \rho x_{t-1})^{\top} \beta + (u_t - \rho u_{t-1}) = (x_t - \rho x_{t-1})^{\top} \beta + \varepsilon_t

其中 εt\varepsilon_t 为白噪声。将上述两式合并,变换后的模型可写作:

y~t=x~tβ+εt,t=1,2,,T\tilde{y}_t = \tilde{x}_t^{\top} \beta + \varepsilon_t, \quad t = 1, 2, \ldots, T

其中:

y~1=1ρ2y1,x~1=1ρ2x1\tilde{y}_1 = \sqrt{1 - \rho^2} \, y_1, \quad \tilde{x}_1 = \sqrt{1 - \rho^2} \, x_1
y~t=ytρyt1,x~t=xtρxt1,t2\tilde{y}_t = y_t - \rho y_{t-1}, \quad \tilde{x}_t = x_t - \rho x_{t-1}, \quad t \geq 2

变换后的模型满足经典线性回归的全部假设,可直接应用 OLS 估计,得到BLUE(最佳线性无偏估计量),即GLS估计量

与 Cochrane-Orcutt 方法的比较

Prais-Winsten变换Cochrane-Orcutt迭代法 是处理 AR(1) 自相关的两种最常用的可行广义最小二乘法 (FGLS)。二者的核心差异在于:

  • Cochrane-Orcutt方法:舍弃第一期观测值,仅对 t=2,3,,Tt = 2, 3, \ldots, T 应用差分变换 ytρyt1y_t - \rho y_{t-1}xtρxt1x_t - \rho x_{t-1}。这意味着有效样本量从 TT 减少为 T1T - 1
  • Prais-Winsten方法:保留第一期观测值,对其进行 1ρ2\sqrt{1 - \rho^2} 的缩放变换,从而有效利用全部 TT 个观测值。

大样本TT \to \infty)下,两种方法渐近等价,因为舍弃一个观测值的影响可忽略不计。但在小样本中,Prais-Winsten变换通常更为有效:其估计量的均方误差 (MSE) 更小,对 ρ\rho 的估计更为精确。当自相关系数 ρ\rho 接近1时,1ρ2\sqrt{1 - \rho^2} 趋近于0,Prais-Winsten变换与 Cochrane-Orcutt 方法的差异趋于消失。当 ρ\rho 接近0时,保留第一期观测值的信息增益最为显著。

此外,Cochrane-Orcutt 方法通常采用迭代算法:先以 OLS 残差估计 ρ\rho,进行变换后再估计 β\beta,重复此过程直至收敛。Prais-Winsten 变换也可采用类似的迭代策略,在实践中两种方法常被交替使用以验证结果的稳健性。

可行 Prais-Winsten 估计

在实际应用中,自相关系数 ρ\rho 为未知参数,需要从数据中估计。标准的估计步骤如下:

  1. 对原模型应用 OLS 估计,得到残差序列 u^t\hat{u}_t
  2. 从 OLS 残差中估计 ρ\rho,常用方法包括: \begin{itemize}
  3. Durbin-Watson 统计量ρ^1d2\hat{\rho} \approx 1 - \frac{d}{2},其中 ddDurbin-Watson检验统计量。
  4. 残差自回归:对 u^t=ρu^t1+νt\hat{u}_t = \rho \hat{u}_{t-1} + \nu_t 应用 OLS。
  5. Cochrane-Orcutt 迭代:将 ρ\rho 的估计嵌入迭代循环。 \end{itemize}
  6. 用估计值 ρ^\hat{\rho} 替代真实 ρ\rho,执行 Prais-Winsten 变换。
  7. 对变换后的数据应用 OLS,得到可行广义最小二乘 (FGLS) 估计量。

需要指出的是,两步法(先估计 ρ\rho 再变换)得到的 FGLS 估计量在大样本下与 GLS 具有相同的渐近分布,但小样本性质可能受到 ρ\rho 估计误差的影响。Bootstrap方法可用于改进小样本推断的精度。

应用与局限

Prais-Winsten变换在时间序列计量经济学中有着广泛的应用场景,尤其适用于以下情形:

Prais-Winsten变换的局限性主要体现在以下方面:

第一,该方法将误差结构限定为 AR(1) 过程。当自相关结构为更高阶的 AR(p)、MA(q) 或 ARMA(p,q) 时,应使用更一般的ARMA模型广义矩估计 (GMM) 方法。

第二,若模型中包含滞后被解释变量 (Lagged Dependent Variable),则 Prais-Winsten 变换将导致内生性问题,此时 OLS 和 FGLS 均不一致,须使用工具变量法 (IV) 或广义矩估计

第三,实践中的 ρ\rho 估计存在不确定性,FGLS 的小样本偏差可能不可忽视。对于样本量较小的研究,建议同时报告 OLS 估计(辅以Newey-West稳健标准误)和 Prais-Winsten 估计,以评估结果对自相关处理方式的敏感性。

第四,当数据存在异方差性时,单纯的自相关校正并不充分,此时应考虑异方差自相关稳健标准误 (HAC 标准误) 或更一般的可行广义最小二乘法

数值示例

为直观说明 Prais-Winsten 变换的效果,考虑一个简单的人工数据示例。假设真实数据生成过程为:

yt=2+0.5xt+ut,ut=0.7ut1+εt,εtN(0,1)y_t = 2 + 0.5 x_t + u_t, \quad u_t = 0.7 u_{t-1} + \varepsilon_t, \quad \varepsilon_t \sim \mathcal{N}(0, 1)

其中 xtx_t 为独立于误差项的平稳时间序列。在样本量 T=50T = 50 的情形下,分别应用 OLS、Cochrane-Orcutt 方法和 Prais-Winsten 变换进行估计。

在典型实现中,OLS 估计的斜率系数估计量虽仍近似无偏,但其标准误被严重低估。例如,OLS 报告的 xtx_t 系数标准误约为 0.08,而经自相关校正后的 Prais-Winsten 标准误约为 0.11。若以 OLS 标准误进行 t 检验,第一类错误的概率将显著高于名义显著性水平。

Prais-Winsten 变换通过保留第一期观测值,在 T=50T = 50 的场景下使估计量的方差相对于 Cochrane-Orcutt 方法降低约 2\%--5\%。这一差异随样本量增大而缩小,但对于金融或宏观经济学中的中等样本(T=30T = 30T=100T = 100),Prais-Winsten 变换仍是更优的选择。

软件实现

主流的计量经济学软件均提供 Prais-Winsten 变换的内置支持:

  • Stata:使用 \texttt{prais} 命令,通过选项 \texttt{corc} 可切换至 Cochrane-Orcutt 方法。
  • R:\texttt{orcutt} 包中的 \texttt{cochrane.orcutt()} 函数以及 \texttt{nlme} 包中的 \texttt{gls()} 函数支持相关设定。
  • Python:\texttt{statsmodels} 库中的 \texttt{GLSAR} 类可实现可行的 Prais-Winsten 估计。
  • EViews:在方程估计中选择 AR(1) 误差项时,默认使用 Prais-Winsten 变换。

不同软件在迭代收敛准则、缺失值处理和 ρ\rho 的初始估计方法上存在细微差异,建议在报告结果时明确标注所使用的软件和算法参数。

小结

Prais-Winsten变换是处理一阶自相关问题的标准工具之一。其核心贡献在于通过精确处理第一期观测值,弥补了 Cochrane-Orcutt 方法在小样本下的信息损失。该方法与广义差分法Cochrane-Orcutt迭代法以及Newey-West标准误共同构成了时间序列回归中自相关问题的完整处理工具箱。在实际应用中,研究者应根据样本量、误差结构的具体形式和模型的动态设定,审慎选择最适合的自相关处理方法。