ARTICLE
计量经济学
计量经济学 (Econometrics) 计量经济学 (Econometrics) 是一门运用统计学和数学方法,对经济学理论和模型进行实证检验、参数估计、假设检验以及经济预测的学科。它的核心使命是为抽象的经济理论提供经验证据(empirical evidence),将理论模型与现实世界的经济数据联系起来,从而使经济学从定性描述走向定量分析。 计量经济学可以被
计量经济学 (Econometrics)
计量经济学 (Econometrics) 是一门运用统计学和数学方法,对经济学理论和模型进行实证检验、参数估计、假设检验以及经济预测的学科。它的核心使命是为抽象的经济理论提供经验证据(empirical evidence),将理论模型与现实世界的经济数据联系起来,从而使经济学从定性描述走向定量分析。
计量经济学可以被视为经济学、数学和统计学的交叉领域。它并非简单地将这三门学科相加,而是形成了一套独特的方法论,专门用于处理具有非实验性、随机性特征的经济数据。
经典计量经济学方法论 (Classical Econometric Methodology)
一个典型的计量经济学研究通常遵循以下步骤,这构成了其核心的研究范式:
- 建立数学模型:将经济理论用数学方程的形式表达出来。对于上述例子,可以建立一个简单的线性函数关系:
- 设定计量经济模型:数学模型是精确的、确定性的,但现实经济关系充满了不确定性。因此,我们需要在数学模型中加入一个随机扰动项(Stochastic Error Term),记为 。这个扰动项代表了所有影响因变量、但未被模型明确包含的因素(如消费者情绪、未观测到的个体差异、测量误差等)。
其中, 是第 个个体的消费(因变量), 是其可支配收入(自变量), 和 是模型的未知参数(Parameters),而 是随机扰动项。
- 估计模型参数:使用收集到的数据,运用统计方法估计出未知参数 和 的值(记为 和 )。最常用的方法是普通最小二乘法 (Ordinary Least Squares, OLS)。
- 预测与政策分析:利用估计出的模型进行预测,或评估某项经济政策可能产生的影响。
核心模型:经典线性回归模型 (Classical Linear Regression Model, CLRM)
计量经济学入门的核心是经典线性回归模型。它旨在解释一个因变量 如何被一个或多个自变量 线性影响。
以最简单的一元线性回归模型为例:
- :因变量 (Dependent Variable),是被解释的变量,如消费、工资、GDP等。
- :自变量 (Independent Variable),也称解释变量 (Explanatory Variable),用于解释 变化的变量,如收入、教育年限、政府支出等。
- :截距项 (Intercept),表示当所有自变量为零时, 的期望值。
- :斜率系数 (Slope Coefficient),衡量当自变量 变化一个单位时,因变量 的期望变化量。这是通常最受关注的参数,因为它量化了变量之间的关系。
- :随机扰动项 或 误差项 (Error Term),这是一个至关重要的非观测部分,它捕捉了除 以外所有影响 的因素。
参数估计:普通最小二乘法 (OLS)
OLS的目标是找到一条回归线,使得所有观测点到这条线的垂直距离的平方和最小。这个被最小化的量被称为残差平方和 (Sum of Squared Residuals, SSR)。 对于每一个观测值 ,其残差 定义为实际值与模型拟合值之差:
OLS估计量 和 是通过求解以下最小化问题得到的:
通过微积分求一阶导数并令其为零,可以解出 和 的表达式。
OLS的优良性质:高斯-马尔可夫定理 (Gauss-Markov Theorem)
高斯-马尔可夫定理是计量经济学的基石之一。它指出,在一组被称为经典线性模型假设(或高斯-马尔可夫假设)的条件下,OLS估计量是所有线性无偏估计量中方差最小的估计量,即具有最佳线性无偏估计量 (Best Linear Unbiased Estimator, BLUE) 的性质。
主要的经典假设包括:
- 线性于参数:模型 在参数上是线性的。
- 随机抽样:数据集是来自总体的随机样本。
- 不存在完全共线性:在多元回归中,自变量之间不能存在精确的线性关系。这保证了估计量可以被唯一确定。
- 零条件均值:。这是最关键的假设,意味着扰动项 的期望值不随任何自变量的取值而改变。违反该假设会导致内生性问题。
- 同方差性 (Homoskedasticity):。扰动项的方差是常数,不随自变量的取值而改变。
当这些假设成立时,OLS不仅是无偏的 (Unbiased)(即 ),而且在所有其他线性无偏估计方法中,它是最有效的 (Efficient)(即方差最小)。
实践中的挑战:经典假设的违反
在现实世界的研究中,高斯-马尔可夫假设常常被违反,这催生了计量经济学中更高级的理论和方法。
- 异方差性 (Heteroskedasticity):当假设5不成立时(即扰动项方差随自变量变化),OLS估计量虽然仍是无偏的,但不再是BLUE。更严重的是,常规的标准误计算公式是错误的,导致假设检验(如t检验和F检验)失效。解决方法包括使用稳健标准误 (Robust Standard Errors)。
- 内生性 (Endogeneity):这是计量分析中最严重的问题,它发生在零条件均值假设(假设4)被违反时。内生性将导致OLS估计量是有偏的 (Biased) 和 不一致的 (Inconsistent)。主要来源包括:
- 遗漏变量偏误 (Omitted Variable Bias):模型遗漏了某个既影响 又与 相关的变量。
- 测量误差 (Measurement Error):自变量或因变量的测量不准确。
- 联立性偏误 (Simultaneity Bias): 和 相互决定,存在反向因果关系。
解决内生性问题的主要方法是工具变量法 (Instrumental Variables, IV) 和更为复杂的模型,如联立方程模型。
计量经济学的主要分支
随着理论和计算能力的发展,计量经济学已发展出众多分支,以应对不同类型的数据和研究问题:
- 时间序列计量经济学 (Time Series Econometrics):专门处理按时间顺序排列的数据,关注其动态结构、冲击响应和预测。核心模型包括ARMA模型、VAR模型以及处理非平稳性的协整理论。
- 面板数据分析 (Panel Data Analysis):结合了截面数据和时间序列数据的维度,通过追踪多个个体在多个时期的变化,能够控制不可观测的个体异质性。主要方法有固定效应模型和随机效应模型。
- 微观计量经济学 (Microeconometrics):专注于分析个体层面(如个人、家庭、企业)的数据。由于许多微观决策是离散的(如是否工作、选择何种交通工具),该领域发展了离散选择模型(如Logit模型和Probit模型)和处理样本选择问题的模型。