ARTICLE
因变量 (Dependent Variable)
因变量 (Dependent Variable) 因变量 (Dependent Variable),也称被解释变量 (Explained Variable)、响应变量 (Response Variable) 或回归子 (Regressand),是回归分析和统计建模中的核心概念。在统计模型中,因变量是被预测、被解释或被建模的变量,其数值被认为依赖于一个或多个自
因变量 (Dependent Variable)
因变量 (Dependent Variable),也称被解释变量 (Explained Variable)、响应变量 (Response Variable) 或回归子 (Regressand),是回归分析和统计建模中的核心概念。在统计模型中,因变量是被预测、被解释或被建模的变量,其数值被认为依赖于一个或多个自变量(Independent Variable)的变化。在回归方程 中, 即为因变量, 为自变量。
在回归分析中的角色
在线性回归模型中,因变量的角色可以从多个角度理解。从因果角度,研究者将因变量视为受自变量影响的"结果"或"输出";从预测角度,因变量是利用自变量信息进行预测的目标变量。在OLS估计中,最小化的正是因变量与预测值之间的残差平方和:
因变量的类型与建模选择
因变量的测量尺度决定了适用的统计模型类型。连续因变量(如GDP、工资、温度)适合使用经典线性回归、方差分析等方法。二值因变量(如是否购买、是否违约,取0/1值)需使用逻辑回归或Probit模型。计数因变量(如专利数量、事故次数)适用泊松回归或负二项回归。分类因变量(多类别无序)使用多项Logit模型。截断或因变量需用Tobit模型或样本选择模型。正确识别因变量的类型是选择合适计量经济学模型的第一步。
与自变量的区别及常见误区
因变量与自变量的关键区别在于模型中的因果方向设定。因变量是模型试图解释的对象,而自变量是用于解释的工具。在实验设计中,因变量对应实验的"输出"或"测量结果",自变量对应"处理"或"操纵因素"。常见的误区包括因果方向的倒置、遗漏导致内生性的关键自变量、以及将相关性等同于因果关系。在工具变量法中,选择的工具变量应与误差项无关但必须与内生自变量相关,而不能直接影响因变量。因变量的正确设定和测量是实证研究设计中确保内部有效性和外部有效性的基础。