ARTICLE

推断

推断 (Inference) 推断(Inference)在统计学与计量经济学中特指统计推断(Statistical Inference),即利用样本数据对未知总体特征或参数做出结论的方法论体系。推断将概率论的演绎逻辑反转:概率论从已知总体推演样本行为,推断则从观测样本反推总体性质,是现代经济学实证研究的核心方法论。 推断的两大支柱:估计与检验 统计推断在经典

浏览 1 更新 2026-07-18

推断 (Inference)

推断(Inference)在统计学与计量经济学中特指统计推断(Statistical Inference),即利用样本数据对未知总体特征或参数做出结论的方法论体系。推断将概率论的演绎逻辑反转:概率论从已知总体推演样本行为,推断则从观测样本反推总体性质,是现代经济学实证研究的核心方法论。

推断的两大支柱:估计与检验

统计推断在经典频率学派框架下分为两个密切联系的分支:参数估计假设检验

参数估计(Parameter Estimation)利用样本统计量推断总体参数,分为点估计与区间估计。点估计(Point Estimation)用单个统计量(如样本均值 Xˉ\bar{X})作为总体参数(如 μ\mu)的估计值,评价标准包括无偏性有效性一致性充分性区间估计(Interval Estimation)构造置信区间,以置信水平 1α1-\alpha 覆盖未知真值——其含义是重复抽样中区间覆盖真值的频率,而非单次区间包含参数的概率。

假设检验(Hypothesis Testing)由奈曼皮尔逊系统化:设定原假设 H0H_0备择假设 H1H_1,基于检验统计量判断是否拒绝 H0H_0。核心度量包括第I类错误(拒真,α\alpha)、第II类错误(存伪,β\beta)及检验功效1β1-\beta)。p值——H0H_0 为真时观察到当前及更极端结果的概率——是检验决策的常用工具,α=0.05\alpha = 0.05 已成社会科学事实标准,但也引发了对p值滥用和统计显著性误读的广泛反思。

推断的前提与限度

统计推断须以适当抽样的代表性样本为前提。当样本非随机(如观测数据中的自选择偏误)时,直接推断易产生内生性问题,使估计量失去因果解释效力。现代计量经济学的回应包括工具变量法双重差分法(DiD)、断点回归设计(RDD)等因果推断方法。另一关键局限:统计显著不等于经济显著——大样本中几乎任何非零效应都会统计显著,而小样本中即使大效应也可能不显著。推断结论须始终结合效应大小与经济理论综合评判。