ARTICLE

实验设计

实验设计 (Design of Experiments) 实验设计 (Design of Experiments, DOE),亦称 试验设计,是 应用统计学 的重要分支。它提供一套系统性的方法论,用于规划、执行、分析和解释在受控条件下进行的 实验。其核心目标是以最经济有效的方式研究一个或多个 因子 (Factors) 的变化如何影响一个或多个 响应变量 (R

浏览 39 更新 2025-10-26

实验设计 (Design of Experiments)

实验设计 (Design of Experiments, DOE),亦称 试验设计,是 应用统计学 的重要分支。它提供一套系统性的方法论,用于规划、执行、分析和解释在受控条件下进行的 实验。其核心目标是以最经济有效的方式研究一个或多个 因子 (Factors) 的变化如何影响一个或多个 响应变量 (Response Variables),从而建立变量间的 因果关系 (Causality)。

与仅被动收集数据的 观测性研究 (Observational Study) 不同,实验设计涉及主动对系统施加干预(即处理),并观察其结果。通过精心设计,研究者可有效分离不同因子的影响、评估因子间的交互作用,并量化实验中的 随机误差,从而得出具有高信度与效度的结论。该学科最早由 罗纳德\\.费雪 (Ronald A.\ Fisher) 在 20 世纪 20 年代于农业田间试验中系统建立,此后广泛应用于工业工程、医药研发、社会科学和现代数据科学等领域。

基本原则

实验设计的三个基本原则均由费雪奠定,是保证实验结果有效性的基石。

随机化 (Randomization)

随机化是指将 实验单元 (Experimental Units) 以已知概率机制分配到不同的 处理 (Treatments) 组。其核心作用是避免系统性 偏差 (Systematic Bias):通过随机分配,潜在 混杂变量 (Confounding Variables)——包括已知和未知因素——被平均分布于各组,使组间差异更可能归因于处理本身。随机化也是 统计推断假设检验p值 计算的理论基础。

重复 (Replication)

重复是指同一处理被独立地施加到两个或以上的实验单元。重复不同于重复测量(后者在同一单元上进行多次测量)。重复的主要目的有二:其一,提供 实验误差 的估计——观测相同处理下不同单元的响应差异可估算随机误差的大小,作为评估处理效应是否显著的基准;其二,提高估计精度——增加重复次数可减小处理效应估计的 标准误 (Standard Error),从而提高 统计功效 (Statistical Power)。

区组化 (Blocking)

区组化是将性质相似的实验单元划分到同一 区组 (Block),在每个区组内部将处理随机分配给单元。其目的是使区组内部尽可能同质、区组间差异尽可能大,从而将已知变异源从实验误差中分离出来,提高实验精确度。随机区组设计 (Randomized Complete Block Design, RCBD) 是该原则的典型应用。

核心概念

  • 实验单元 (Experimental Unit):接受处理并进行独立观测的最小实体,如一块试验田、一名患者或一个工业产品。
  • 因子 (Factor):研究者主动操纵的 自变量,如温度、压力或药物类型。因子可分为分类因子和连续因子。
  • 水平 (Level):因子的具体取值或状态。例如温度可设 100C100^{\circ}\text{C}150C150^{\circ}\text{C} 两个水平。
  • 处理 (Treatment):施加给实验单元的具体干预措施。在单因子实验中,一个处理即为一个因子水平;在多因子实验中,处理是所有因子水平的一个特定组合。
  • 响应变量 (Response Variable):衡量处理效果的 因变量,如作物产量、产品合格率或患者康复时间。
  • 交互作用 (Interaction):当一个因子的效应大小或方向取决于另一因子的水平时,称二者存在交互作用。例如某种肥料在水分充足时显著增产,在干旱条件下却效果不佳——此时肥料与水分之间存在交互作用。这是 因子设计 相对于单次单因子实验 (OFAT) 的主要优势。
  • 实验误差 (Experimental Error):相同处理下不同实验单元响应变量间的差异,反映实验单元内在变异与测量误差的总和。

主要设计类型

完全随机化设计 (CRD)

最简单的设计,适用于所有实验单元高度同质的情形。处理被完全随机分配给所有单元,分析通常使用 单向方差分析 (One-Way ANOVA)。其优点是实施简便、自由度最大,缺点是无法控制已知变异源。

随机区组设计 (RCBD)

当存在一个主要的已知异质性来源时使用。实验单元先分入同质区组,再在各区组内随机分配处理,能有效控制该方向的变异,降低误差均方,提高检验灵敏度。若区组内单元数量等于处理数,则每个处理在每个区组内恰好出现一次。

拉丁方设计 (Latin Square Design)

当存在两个需要控制的方向性变异源(即两个区组因子)时使用。它要求处理数、行区组数和列区组数必须相等,适用于实验单元在两个维度上均存在异质性的情形。

因子设计 (Factorial Design)

同时研究两个或多个因子及其交互作用。它评估因子水平的所有组合,而非一次只改变一个因子。包含 kk 个因子、每因子 2 个水平的设计称为 2k2^{k} 因子设计。其优势在于高效性——在相同资源下可获取比系列单因子实验更多的信息——以及探测交互作用的能力。

部分因子设计 (Fractional Factorial Design)

当因子数量较多时,2k2^{k} 设计的实验次数呈指数增长,成本过高。部分因子设计选取所有组合中精心挑选的一个子集进行实验,以牺牲对高阶交互作用的估计为代价大幅减少实验次数,常用于早期筛选阶段。

实施步骤

  1. 明确问题与目标:清晰陈述研究问题、待验证假设以及期望达成的目标。
  2. 识别变量与范围:确定响应变量、研究因子及其水平范围。
  3. 选择实验设计:根据因子数量、实验单元特点和资源限制选择合适的设计类型。
  4. 确定样本量:利用功效分析确保实验具备足够的 统计功效 以检测预期的效应大小。
  5. 制定方案并执行:编写详细实验流程,实施随机化,严格按方案操作并记录数据。
  6. 数据分析:使用 方差分析 (ANOVA) 或 回归分析 等工具检验因子显著性。
  7. 解释与结论:说明哪些因子显著、是否存在交互作用,并根据实验目标得出科学结论与实践建议。