ARTICLE

实验设计

实验设计 (Design of Experiments) 实验设计 (Design of Experiments, DOE)，亦称试验设计，是应用统计学的重要分支。它提供一套系统性的方法论，用于规划、执行、分析和解释在受控条件下进行的实验。其核心目标是以最经济有效的方式研究一个或多个因子 (Factors) 的变化如何影响一个或多个响应变量 (R

浏览 39 更新 2025-10-26

实验设计 (Design of Experiments)

实验设计 (Design of Experiments, DOE)，亦称 试验设计，是应用统计学的重要分支。它提供一套系统性的方法论，用于规划、执行、分析和解释在受控条件下进行的实验。其核心目标是以最经济有效的方式研究一个或多个因子 (Factors) 的变化如何影响一个或多个响应变量 (Response Variables)，从而建立变量间的因果关系 (Causality)。

与仅被动收集数据的观测性研究 (Observational Study) 不同，实验设计涉及主动对系统施加干预（即处理），并观察其结果。通过精心设计，研究者可有效分离不同因子的影响、评估因子间的交互作用，并量化实验中的随机误差，从而得出具有高信度与效度的结论。该学科最早由罗纳德\\.费雪 (Ronald A.\ Fisher) 在 20 世纪 20 年代于农业田间试验中系统建立，此后广泛应用于工业工程、医药研发、社会科学和现代数据科学等领域。

基本原则

实验设计的三个基本原则均由费雪奠定，是保证实验结果有效性的基石。

随机化 (Randomization)

随机化是指将实验单元 (Experimental Units) 以已知概率机制分配到不同的处理 (Treatments) 组。其核心作用是避免系统性偏差 (Systematic Bias)：通过随机分配，潜在混杂变量 (Confounding Variables)——包括已知和未知因素——被平均分布于各组，使组间差异更可能归因于处理本身。随机化也是统计推断如假设检验和 p值计算的理论基础。

重复 (Replication)

重复是指同一处理被独立地施加到两个或以上的实验单元。重复不同于重复测量（后者在同一单元上进行多次测量）。重复的主要目的有二：其一，提供实验误差的估计——观测相同处理下不同单元的响应差异可估算随机误差的大小，作为评估处理效应是否显著的基准；其二，提高估计精度——增加重复次数可减小处理效应估计的标准误 (Standard Error)，从而提高统计功效 (Statistical Power)。

区组化 (Blocking)

区组化是将性质相似的实验单元划分到同一区组 (Block)，在每个区组内部将处理随机分配给单元。其目的是使区组内部尽可能同质、区组间差异尽可能大，从而将已知变异源从实验误差中分离出来，提高实验精确度。随机区组设计 (Randomized Complete Block Design, RCBD) 是该原则的典型应用。

核心概念

实验单元 (Experimental Unit)：接受处理并进行独立观测的最小实体，如一块试验田、一名患者或一个工业产品。
因子 (Factor)：研究者主动操纵的自变量，如温度、压力或药物类型。因子可分为分类因子和连续因子。
水平 (Level)：因子的具体取值或状态。例如温度可设 $100^{\circ}\text{C}$ 和 $150^{\circ}\text{C}$ 两个水平。
处理 (Treatment)：施加给实验单元的具体干预措施。在单因子实验中，一个处理即为一个因子水平；在多因子实验中，处理是所有因子水平的一个特定组合。
响应变量 (Response Variable)：衡量处理效果的因变量，如作物产量、产品合格率或患者康复时间。
交互作用 (Interaction)：当一个因子的效应大小或方向取决于另一因子的水平时，称二者存在交互作用。例如某种肥料在水分充足时显著增产，在干旱条件下却效果不佳——此时肥料与水分之间存在交互作用。这是因子设计相对于单次单因子实验 (OFAT) 的主要优势。
实验误差 (Experimental Error)：相同处理下不同实验单元响应变量间的差异，反映实验单元内在变异与测量误差的总和。

主要设计类型

完全随机化设计 (CRD)

最简单的设计，适用于所有实验单元高度同质的情形。处理被完全随机分配给所有单元，分析通常使用单向方差分析 (One-Way ANOVA)。其优点是实施简便、自由度最大，缺点是无法控制已知变异源。

随机区组设计 (RCBD)

当存在一个主要的已知异质性来源时使用。实验单元先分入同质区组，再在各区组内随机分配处理，能有效控制该方向的变异，降低误差均方，提高检验灵敏度。若区组内单元数量等于处理数，则每个处理在每个区组内恰好出现一次。

拉丁方设计 (Latin Square Design)

当存在两个需要控制的方向性变异源（即两个区组因子）时使用。它要求处理数、行区组数和列区组数必须相等，适用于实验单元在两个维度上均存在异质性的情形。

因子设计 (Factorial Design)

同时研究两个或多个因子及其交互作用。它评估因子水平的所有组合，而非一次只改变一个因子。包含 $k$ 个因子、每因子 2 个水平的设计称为 $2^{k}$ 因子设计。其优势在于高效性——在相同资源下可获取比系列单因子实验更多的信息——以及探测交互作用的能力。

部分因子设计 (Fractional Factorial Design)

当因子数量较多时， $2^{k}$ 设计的实验次数呈指数增长，成本过高。部分因子设计选取所有组合中精心挑选的一个子集进行实验，以牺牲对高阶交互作用的估计为代价大幅减少实验次数，常用于早期筛选阶段。

实施步骤

明确问题与目标：清晰陈述研究问题、待验证假设以及期望达成的目标。
识别变量与范围：确定响应变量、研究因子及其水平范围。
选择实验设计：根据因子数量、实验单元特点和资源限制选择合适的设计类型。
确定样本量：利用功效分析确保实验具备足够的统计功效以检测预期的效应大小。
制定方案并执行：编写详细实验流程，实施随机化，严格按方案操作并记录数据。
数据分析：使用方差分析 (ANOVA) 或回归分析等工具检验因子显著性。
解释与结论：说明哪些因子显著、是否存在交互作用，并根据实验目标得出科学结论与实践建议。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。