ARTICLE
实验设计
实验设计 (Design of Experiments) 实验设计 (Design of Experiments, DOE),亦称 试验设计,是 应用统计学 的重要分支。它提供一套系统性的方法论,用于规划、执行、分析和解释在受控条件下进行的 实验。其核心目标是以最经济有效的方式研究一个或多个 因子 (Factors) 的变化如何影响一个或多个 响应变量 (R
实验设计 (Design of Experiments)
实验设计 (Design of Experiments, DOE),亦称 试验设计,是 应用统计学 的重要分支。它提供一套系统性的方法论,用于规划、执行、分析和解释在受控条件下进行的 实验。其核心目标是以最经济有效的方式研究一个或多个 因子 (Factors) 的变化如何影响一个或多个 响应变量 (Response Variables),从而建立变量间的 因果关系 (Causality)。
与仅被动收集数据的 观测性研究 (Observational Study) 不同,实验设计涉及主动对系统施加干预(即处理),并观察其结果。通过精心设计,研究者可有效分离不同因子的影响、评估因子间的交互作用,并量化实验中的 随机误差,从而得出具有高信度与效度的结论。该学科最早由 罗纳德\\.费雪 (Ronald A.\ Fisher) 在 20 世纪 20 年代于农业田间试验中系统建立,此后广泛应用于工业工程、医药研发、社会科学和现代数据科学等领域。
基本原则
实验设计的三个基本原则均由费雪奠定,是保证实验结果有效性的基石。
随机化 (Randomization)
随机化是指将 实验单元 (Experimental Units) 以已知概率机制分配到不同的 处理 (Treatments) 组。其核心作用是避免系统性 偏差 (Systematic Bias):通过随机分配,潜在 混杂变量 (Confounding Variables)——包括已知和未知因素——被平均分布于各组,使组间差异更可能归因于处理本身。随机化也是 统计推断 如 假设检验 和 p值 计算的理论基础。
重复 (Replication)
重复是指同一处理被独立地施加到两个或以上的实验单元。重复不同于重复测量(后者在同一单元上进行多次测量)。重复的主要目的有二:其一,提供 实验误差 的估计——观测相同处理下不同单元的响应差异可估算随机误差的大小,作为评估处理效应是否显著的基准;其二,提高估计精度——增加重复次数可减小处理效应估计的 标准误 (Standard Error),从而提高 统计功效 (Statistical Power)。
区组化 (Blocking)
区组化是将性质相似的实验单元划分到同一 区组 (Block),在每个区组内部将处理随机分配给单元。其目的是使区组内部尽可能同质、区组间差异尽可能大,从而将已知变异源从实验误差中分离出来,提高实验精确度。随机区组设计 (Randomized Complete Block Design, RCBD) 是该原则的典型应用。
核心概念
- 实验单元 (Experimental Unit):接受处理并进行独立观测的最小实体,如一块试验田、一名患者或一个工业产品。
- 因子 (Factor):研究者主动操纵的 自变量,如温度、压力或药物类型。因子可分为分类因子和连续因子。
- 水平 (Level):因子的具体取值或状态。例如温度可设 和 两个水平。
- 处理 (Treatment):施加给实验单元的具体干预措施。在单因子实验中,一个处理即为一个因子水平;在多因子实验中,处理是所有因子水平的一个特定组合。
- 响应变量 (Response Variable):衡量处理效果的 因变量,如作物产量、产品合格率或患者康复时间。
- 交互作用 (Interaction):当一个因子的效应大小或方向取决于另一因子的水平时,称二者存在交互作用。例如某种肥料在水分充足时显著增产,在干旱条件下却效果不佳——此时肥料与水分之间存在交互作用。这是 因子设计 相对于单次单因子实验 (OFAT) 的主要优势。
- 实验误差 (Experimental Error):相同处理下不同实验单元响应变量间的差异,反映实验单元内在变异与测量误差的总和。
主要设计类型
完全随机化设计 (CRD)
最简单的设计,适用于所有实验单元高度同质的情形。处理被完全随机分配给所有单元,分析通常使用 单向方差分析 (One-Way ANOVA)。其优点是实施简便、自由度最大,缺点是无法控制已知变异源。
随机区组设计 (RCBD)
当存在一个主要的已知异质性来源时使用。实验单元先分入同质区组,再在各区组内随机分配处理,能有效控制该方向的变异,降低误差均方,提高检验灵敏度。若区组内单元数量等于处理数,则每个处理在每个区组内恰好出现一次。
拉丁方设计 (Latin Square Design)
当存在两个需要控制的方向性变异源(即两个区组因子)时使用。它要求处理数、行区组数和列区组数必须相等,适用于实验单元在两个维度上均存在异质性的情形。
因子设计 (Factorial Design)
同时研究两个或多个因子及其交互作用。它评估因子水平的所有组合,而非一次只改变一个因子。包含 个因子、每因子 2 个水平的设计称为 因子设计。其优势在于高效性——在相同资源下可获取比系列单因子实验更多的信息——以及探测交互作用的能力。
部分因子设计 (Fractional Factorial Design)
当因子数量较多时, 设计的实验次数呈指数增长,成本过高。部分因子设计选取所有组合中精心挑选的一个子集进行实验,以牺牲对高阶交互作用的估计为代价大幅减少实验次数,常用于早期筛选阶段。