ARTICLE

简单线性回归

简单线性回归 (Simple Linear Regression) 简单线性回归(SLR)是统计学和计量经济学中最基础的回归分析技术,通过直线模型研究两个连续变量的关系。 模型方程 总体回归函数(PRF):E(Y X) = _0 + _1 X(给定X时Y的期望值)。实际观测模型:Y = _0 + _1 X + 。 _0为截距(X=0时Y的期望); _1为斜率

浏览 61 更新 2025-10-25

简单线性回归 (Simple Linear Regression)

简单线性回归(SLR)是统计学计量经济学中最基础的回归分析技术,通过直线模型研究两个连续变量的关系。

模型方程

总体回归函数(PRF):E(YX)=β0+β1XE(Y \mid X) = \beta_0 + \beta_1 X(给定XXYY的期望值)。实际观测模型:Y=β0+β1X+εY = \beta_0 + \beta_1 X + \varepsilonβ0\beta_0截距X=0X=0YY的期望);β1\beta_1斜率XX每增1单位YY期望的平均变化量,符号示关系方向,大小示强度);ε\varepsilon误差项(除XX外所有影响YY的因素总和)。

样本回归函数(SRF):Y^=β^0+β^1X\hat{Y} = \hat{\beta}_0 + \hat{\beta}_1 X。OLS估计量:

β^1=(XiXˉ)(YiYˉ)(XiXˉ)2=Cov(X,Y)Var(X),β^0=Yˉβ^1Xˉ\hat{\beta}_1 = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sum (X_i - \bar{X})^2} = \frac{\mathrm{Cov}(X,Y)}{\mathrm{Var}(X)}, \quad \hat{\beta}_0 = \bar{Y} - \hat{\beta}_1\bar{X}

OLS回归线必经过样本均值点(Xˉ,Yˉ)(\bar{X}, \bar{Y})

经典线性回归假定和高斯-马尔可夫定理

假定:参数线性;随机抽样;自变量有变异;误差项零条件均值(E(εX)=0E(\varepsilon \mid X)=0无偏性关键);同方差性;无序列相关;误差项正态性(假设检验所需)。满足前5条→高斯-马尔可夫定理:OLS为最佳线性无偏估计量(BLUE)——所有线性无偏估计量中方差最小。

拟合优度与统计推断

决定系数 R2=ESS/TSS=1RSS/TSS[0,1]R^2 = ESS/TSS = 1 - RSS/TSS \in [0,1],衡量XX解释YY变异的比例。简单线性回归下R2=r2R^2 = r^2rr相关系数)。

对斜率检验H0:β1=0H_0: \beta_1 = 0 vs H1:β10H_1: \beta_1 \neq 0。t统计量:t=β^1/se(β^1)t = \hat{\beta}_1 / \mathrm{se}(\hat{\beta}_1)se\mathrm{se}标准误)。若p-value < 显著性水平 α\alpha,拒绝H0H_0。也可构建β1\beta_1置信区间

重要提醒

相关不等于因果(可能由遗漏变量驱动或反向因果);外推风险(模型仅在观测范围内有效);异常值可扭曲OLS回归线,需预处理。