ARTICLE
重复测量
重复测量 (Repeated Measures) 重复测量(Repeated Measures)是实验设计和统计推断中的一种重要方法,指对同一组受试对象(Subjects)在不同条件或不同时间点上进行多次观测的实验策略。重复测量设计广泛应用于计量经济学、心理学、生物医学和金融学等领域的纵向研究(Longitudinal Study)和面板数据分析(Panel
重复测量 (Repeated Measures)
重复测量(Repeated Measures)是实验设计和统计推断中的一种重要方法,指对同一组受试对象(Subjects)在不同条件或不同时间点上进行多次观测的实验策略。重复测量设计广泛应用于计量经济学、心理学、生物医学和金融学等领域的纵向研究(Longitudinal Study)和面板数据分析(Panel Data Analysis)。与独立组设计不同,重复测量设计利用同一受试对象在不同时间点或处理水平下的数据,通过控制个体间异质性来提高统计检验的统计功效。
重复测量设计的基本特征
重复测量设计的核心特征在于数据的非独立性(Non-Independence):由于同一受试者的多次测量结果之间存在相关关系,经典的独立组方差分析(ANOVA)假设不再满足,需要专门的处理方法。
该设计通常包含两类因素:
- 受试者间因素(Between-Subjects Factor):将受试者划分为不同组别的分类变量,例如性别、治疗方法等。
- 受试者内因素(Within-Subjects Factor):对同一受试者反复测量的条件或时间维度,例如不同的时间点(治疗前、治疗后1个月、治疗后3个月)或不同的实验刺激条件。
重复测量设计的一维线性模型可表示为:
其中 为总均值, 为第 个受试者的个体效应(通常被视为随机效应), 为第 次测量或第 种处理条件的固定效应, 为随机误差项。该模型与随机效应模型和混合效应模型有着密切联系。
与独立组设计的比较
重复测量设计相对于独立组设计具有显著优势和固有代价:
优势方面:
- 更高的统计功效:由于每个受试者同时作为自身的对照,个体间的无关变异(Inter-Subject Variability)被有效消除,从而减小误差项,提高检验处理效应的灵敏度。在同等样本量下,重复测量设计通常比独立组设计需要更少的受试者。
- 经济高效:在受试者招募成本高昂的临床试验或经济学田野实验中,重复测量可大幅节约实验成本。
- 研究动态过程:重复测量能够刻画变量随时间的变化轨迹,这在独立组设计中无法实现。例如面板数据的固定效应估计量(Fixed Effects Estimator)正是利用组内变异(Within Variation)来识别因果效应。
代价方面:
- 顺序效应(Order Effects):受试者接受多次测量时,可能出现练习效应(Practice Effect)、疲劳效应(Fatigue Effect)或霍尔效应等顺序影响。随机化和拉丁方设计(Latin Square Design)可用于缓解此问题。
- 缺失数据问题:同一受试者的长期跟踪可能导致样本流失(Attrition),从而产生非随机缺失数据,导致估计偏差。
- 复杂的相关性结构:数据的非独立性要求更复杂的协方差结构建模。
重复测量方差分析
重复测量方差分析(Repeated Measures ANOVA)是最常用的重复测量数据分析方法。它将总变异分解为受试者间变异、受试者内变异和误差变异三部分,其F检验的构造逻辑与单因素方差分析类似,但误差项的选取有所不同。
平方和分解
在单因素重复测量设计中(一个受试者内因素包含 个水平, 个受试者),总平方和的分解为:
其中 反映受试者个体之间的差异, 反映不同测量条件或时间点之间的差异, 是排除了个体效应和处理效应后的剩余变异。检验处理效应的F统计量为:
球形假设
重复测量方差分析的关键前提假设是球形假设(Sphericity Assumption),也称为复合对称性(Compound Symmetry)的更严格形式。球形假设要求任意两次重复测量之间的差值方差相等:
当球形假设被违背时,第一类错误(Type I Error)的概率会膨胀。莫奇利球形检验(Mauchly's Sphericity Test)可用于检验该假设。若球形假设不成立,常用的校正方法包括格林豪斯-盖瑟校正(Greenhouse-Geisser Correction)和胡因-费尔特校正(Huynh-Feldt Correction),它们通过调整自由度来修正F检验的显著性水平。
协方差结构建模
重复测量数据的分析早已超越传统的方差分析框架,发展出更为灵活的混合效应模型(Mixed Effects Model)和广义估计方程(Generalized Estimating Equations, GEE)方法。这些方法的核心优势在于可以灵活指定组内观测值的协方差结构:
- 复合对称(Compound Symmetry, CS):假设任意两次重复测量之间的协方差相等,是传统重复测量ANOVA隐含的假设。
- 一阶自回归结构(AR(1)):假设测量相关性随时间间隔增大而指数衰减,常用于等间距时间序列数据。
- 无结构协方差(Unstructured, UN):不对协方差矩阵施加任何约束,最为灵活但参数估计代价最高。
- 拓扑尔结构(Toeplitz):假设仅依赖于时间间隔而非具体时间点。
在计量经济学中,面板数据模型(Panel Data Model)的固定效应估计(Fixed Effects Estimation)和随机效应估计(Random Effects Estimation)本质上是对重复测量数据的不同处理策略。豪斯曼检验(Hausman Test)用于判断在固定效应和随机效应之间应当选择哪一种。
在经济金融中的应用
重复测量方法在现代经济学研究中占据核心地位。微观计量经济学中的双重差分法(Difference-in-Differences, DiD)本质上是重复测量设计在政策评估中的经典应用:对处理组和对照组在政策实施前后分别进行测量,利用受试者内变异和时间变异来识别因果效应。事件研究法(Event Study)在金融学中广泛用于分析特定事件(如并购公告、盈余发布)对股票价格的冲击,同样依赖于重复测量的逻辑框架。
在行为经济学和实验经济学中,重复测量设计被用于研究个体在多种决策情境下的行为一致性,以及学习和策略调整的动态过程。随机对照试验(RCT)中的交叉设计(Crossover Design)也是重复测量思想的直接体现——每个受试者先后接受多种处理,从而在组内比较处理效果。
局限性与注意事项
尽管重复测量设计具有显著优势,研究者在应用时仍需警惕以下问题:
- 遗留效应(Carryover Effect):一种处理的影响可能延续到后续测量时期,污染后续处理效应的估计。交叉设计中常在处理之间设置洗脱期(Washout Period)来缓解此问题。
- 缺失数据的机制:缺失数据的完全随机缺失(MCAR)、随机缺失(MAR)和非随机缺失(MNAR)三种机制对重复测量分析的稳健性影响不同,需结合多重插补(Multiple Imputation)或最大似然估计等现代缺失数据处理方法。
- 样条和趋势拟合:当重复测量次数较多且时间非等间距时,样条回归或函数型数据分析(Functional Data Analysis)可能是比传统重复测量ANOVA更合适的分析策略。
总之,重复测量作为现代实验设计和数据分析的基本工具,架起了横截面分析与时间序列分析之间的桥梁,为研究人员从动态视角理解经济现象和统计规律提供了强有力的方法论支撑。