实验设计类型的合理选择：合理选用实验设计类型的指导思想及如何选用设计类型实例

作者: brainu 发布于：四月 20, 2014

面对一个具体的实验研究问题，究竟应该选择什么实验设计类型合适呢 ? 本文以实例的方式说明针对具体问题合理如何选用某种设计类型。

合理选用设计类型的指导思想

面对一个具体的实验研究问题，究竟应该选择什么实验设计类型合适呢？

首先应考虑拟考察的实验因素的个数、各因素的水平数以及是否要考察因素之间的交互作用；

其次应考虑必须加以控制的区组因素(即重要的非实验因素)的个数及其水平数；

第三应结合专业知识，考虑因素在施加时有无特殊要求，如「同时施加，还是分先后顺序施加」；同一个因素的各水平作用于受试对象时有无特殊要求，如「每一个受试对象只能接受因素的一个水平，还是可以接受因素的多个水平」；

第四应考虑实验者在经济、时间等方面的承受能力。

将以上4方面综合起来考虑，是针对具体问题合理选用实验设计类型的基本指导思想。

针对具体问题合理选用某种设计类型举例

1. 「成组、配对、交叉」设计中应选择哪一个

例1 已知某中药有一定的降血压作用，先打算通过动物实验了解该药的最适剂量。

研究者根据预实验的结果，拟采用A、B两种可能的剂量，并要求用猫作为受试对象。已知此药的持续作用时间小于6h，6h后血压又会恢复到原先的水平。根据先验知识和对结果的精度要求，按统计公式估算，每一组至少要用5只猫。

问：有哪几种可能的设计类型？其中最优者是哪一种？

分析与解答

设计1：由于该药有两个剂量A和B，故最简单的做法是将10只猫完全随机地均分成2组，1组给药剂量为A，另1组给药剂量为B，即采用「成组设计」。

设计2：我们还可以将10只猫按他们自身的条件，将性别、体重、年龄、健康状况、基础血压值等各方面都相同或接近的每两只猫配成1对，用随机的方法决定其中1只猫接受该药的A剂量，另1只猫接受该药的B剂量，即采用「条件相近者配对设计」。

设计3：若动物饲养中心能明确地区分每只猫所来自的窝别，也知道每只猫的年龄，那么，研究者在领取猫时，可以规定：全部猫的年龄要基本相同，从每一窝中取出2只「性别相同、健康状况和基础血压值等各方面都相同或接近」的猫配成1对，用随机的方法决定其中1只猫接受该药的A剂量，另1只猫接受该药的B剂量，即采用「同源配对设计」。将上述3种设计用表格的形式给出，以便比较，见表1。

上述3种设计都存在一个不足之处：动物的利用率低。因为只要两次用药时间间隔大于6h，可就在同一只猫身上使用该药的两种剂量各实验1次。于是，可以考虑下面的另外3种设计。

设计4：每只猫都先用该药的A剂量，后用该药的B剂量，时间间隔为8h，每次用药前后都测血压值，用其差值作为观测指标，即采用「自身配对设计」。

设计5：将全部10只猫完全随机地均分成2组，用随机的方法决定第1组5只猫使用该药两种剂量的顺序，如先A后B，则第2组中的5只猫使用该药剂量的顺序正好相反。每只猫两次用药的时间间隔为8h，每次用药前后都测血压值，用其差值作为观测指标，即采用「成组交叉设计」。

设计6：将全部10只猫按它们所具备的条件配成5对(配对条件越严越好，如同源配对)，用随机的方法决定每一对中2只猫使用该药两种剂量的顺序，如其中1只猫使用该药剂量的顺序为先A后B，则另1只猫使用该药剂量的顺序正好相反。每只猫两次用药的时间间隔为8h，每次用药前后都测血压值，用其差值作为观测指标，即采用「配对交叉设计」。

将上述3种设计用表格的形式给出，以便比较，见表2。

设计类型点评

显然，后3个设计比前3个设计对动物的利用率提高了，作统计分析时「自由度」也增大了，其结论要相对可靠一些。但设计4(即自身配对设计)还是有问题的，对所有的猫来说，用该药的剂量都是先A后B，这样就人为地引入了「顺序误差」；设计5(即成组交叉设计)是比较好的设计方法，它可以将该药的A、B两个剂量的使用顺序所产生的影响分解出来；从对受试对象个体差异的控制角度来考察，设计6(即配对交叉设计)的效果应该是最好的。

2. 「单因素k水平设计、配伍组设计、拉丁方设计」中应选择哪一个

例2 已知某中药有一定的降血压作用，先打算通过动物实验了解该药的最适剂量。

研究者根据预实验的结果，拟采用A、B、C、D 4种可能的剂量，并要求用猫作为受试对象。已知此药的持续作用时间小于6h，6h后血压又会恢复到原先的水平。根据先验知识和对结果的精度要求，按统计公式估算，每个剂量组至少要用4只猫。

问：有哪几种可能的设计类型？其中最优者是哪一种？

分析与解答

设计1：由于该药有4个剂量，故最简单的做法是将16只猫完全随机地均分成4组，分别给予该药的不同剂量，即采用「单因素4水平设计」。

设计2：我们还可以将16只猫按他们自身的条件，将性别、体重、年龄、健康状况、基础血压值等各方面都相同或接近的每4只猫形成1个配伍组，用随机的方法将每一个配伍组中的4只猫分配到4个剂量组中去，即采用「条件相近者配伍设计」。

设计3：若动物饲养中心能明确地区分每只猫所来自的窝别，也知道每只猫的年龄，那么，研究者在领取猫时，可以规定：全部猫的年龄要基本相同，从每一窝中取出4只「性别相同、健康状况和基础血压值等各方面都相同或接近」的猫形成1个配伍组，用随机的方法将每一个配伍组中的4只猫分配到4个剂量组中去，即采用「同源配伍设计」。

上述3种实验设计也可以用表格的形式给出，其形式如表1类似，此处从略。这3种设计都存在一个不足之处：动物的利用率低。因为只要每两次用药时间间隔大于6h，就可在同1只猫身上使用该药的4种不同剂量各实验1次，于是，可以考虑下面的另外3种设计。

设计4：每只猫都用4次药，在每只猫身上用此药不同剂量的顺序均为A、B、C、D，每相邻两次用药的时间间隔为8h，每次用药前后都测血压值，用其差值作为观测指标。可以只用4只猫来完成此实验，即采用「具有一个重复测量的单因素设计」。

设计5：先将该药的4个剂量A、B、C、D随机化排成一个4行4列的方阵，如：

A 　　　　B 　　　　C 　　　　D
B 　　　　C 　　　　D 　　　　A
C 　　　　D 　　　　A 　　　　B
D 　　　　A 　　　　B 　　　　C

将全部16只猫按它们所具备的条件形成4个配伍组(配伍的条件越严越好，如同源配伍)，将4个配伍组放置在上面4×4拉丁方阵的4行上，用随机的方法决定每一个配伍组中4只猫中的每一只接受该药的一个特定的剂量，而4列就是实验的顺序，每次用药前后都测血压值，用其差值作为观测指标，即采用「独立重复实验的4×4拉丁方设计」。

设计6：先将该药的4个剂量A、B、C、D随机化排成一个4行4列的方阵，如：

A 　　　　B 　　　　C 　　　　D
B 　　　　C 　　　　D 　　　　A
C 　　　　D 　　　　A 　　　　B
D 　　　　A 　　　　B 　　　　C

再将4只猫安排在4行上，其4次实验的结果便形成了一个配伍组，4列代表实验顺序，相当于第2个区组因素。每只猫相邻两次用药的时间间隔为8h，每次用药前后都测血压值，用其差值作为观测指标，即采用「含重复测量的4×4拉丁方设计」。

设计类型点评

显然，在上述的6种实验设计中，设计1最为简单，但对于重要的非实验因素未加任何控制，其结论的可靠性完全取决于「完全随机化」的效果，在各组样本含量都很大的条件下，完全随机化或许可以使重要的非实验因素在各组之间达到平衡一致；样本较小时，其效果就很难说了。

设计2和设计3都是采用「配伍组设计」，只不过是配伍的条件有「一般与较严」之分，配伍的条件越严越好，但在实际工作中较难实现。

设计4是不妥的，因为每只猫接受该药的剂量的顺序是一成不变的，这就必然会引入「顺序误差」。

设计5采用了「独立重复实验拉丁方设计」，使每一配伍组内的4只猫接受该药的不同剂量的顺序是随机的，它实际上是在前面设计2和设计3基础上作的一种改进，其缺点是没有减少样本含量。当然，在每次处理对受试者所造成的「创伤」严重的实验研究中，在同一个受试者身上不能接受2种或2种以上的处理，此时，就不得不使用这一设计或前面的设计2或设计3了。

在同一个体身上可以做重复实验的前提下，设计6是比较理想的设计类型，因为它不仅可以考察1个实验因素、2个区组因素，还对实验因素的水平进行了随机化，同时，又大大减少了样本含量。

3. 「析因设计、正交设计」中应选择哪一个

例3 在培养钩端螺旋体时，除了根据先验知识已固定若干因素外，拟研究以下4个实验因素取不同水平的效应，实验研究的目的是寻找四因素最佳的水平组合。

因素A(血清种类)：A1(兔血清)、A2(胎盘血清)；

因素B(血清浓度)：B1(5%)、B2(8%)；

因素C(基础液)：C1(缓冲液)、C2(蒸馏水)；

因素D(维生素加否)：D1(加)、D2(不加)。

要求一：若需考察因素之间的各级交互作用，应选用什么设计类型？

要求二：若由预实验结果得知，只有A×B、C×D、A×B×D这3个交互作用是必需考虑的，其他交互作用项可忽略不计，此时，适合选择什么设计类型呢？

分析与解答

由题意可知，实验中涉及4个二水平的实验因素，按「要求一」可知，要考察实验因素的各级交互作用，此时，满足要求的惟一设计类型就是四因素析因设计，即将四因素的水平进行全面组合，共有2×2×2×2=16种，各种组合条件下至少要做2次或2次以上独立重复实验。其设计格式如表3所示。

按「要求二」可知，只有少部分交互作用项必须考虑，若仍采用上面的析因设计，将意味着要多做很多次不必要的实验。此时，比较明智的做法是选用合适的二水平正交表进行正交设计。那么，究竟应该选用什么样的二水平正交表呢？

显然，L4(2³)正交表只有3列，是无法安排4个因素和3个交互作用项的；而L8(2⁷)正交表虽然有7列，但在这7列里，也无法合理地安排4个因素和3个交互作用项，因为某些交互作用项会与单个因素所在的列重叠在一起，造成因素与交互作用项效应的混杂，这是无效的设计；看来比较可行的做法是选用L16(2¹⁵)正交表，认真查阅其「对应的交互作用表」，或许能在15列中作出合理的安排，使单个因素的效应不与需要考察的3个交互作用项混杂。当然，对本例而言，选择L16(2¹⁵)正交表，就等价于「未做重复实验的四因素析因设计」，因为4个二水平因素的全面组合总共只有16种。其表头设计见表4。

在表4中，为什么要把AB(即A×B)放在第3列上，把ABD(即A×B×D)放在第11列上，而把CD(即C×D)放在第12列上呢？这是查阅与L16(2¹⁵)正交表对应的交互作用表才可以得到的，这个交互作用表见表5。

从表5中可以查得：第1列与第2列的交互作用出现在第3列上，第3列与第8列的交互作用出现在第11列上，而第4列与第8列的交互作用出现在第12列上。在这个表头设计的基础上，做实验时，只需要抄写安排单个因素的那4列，即第1、2、4、8列。

每行做1次实验(若实验重复起来不困难，人力和物力花费都不大，做2次或2次以上重复实验效果就更好了)，共得16个实验数据，写在表6的最后一列。与表6对应的完整的正交表中还有8个空列派什么用场呢？他们将被用来估计实验误差的大小，等有了实验数据后，进行统计分析时，仍然只需将表6中的4列单个因素的水平代码和最后一列实验数据输入计算机，运用统计程序可以方便地分析4个因素以及3个交互作用项对实验结果的影响大小是否具有统计学意义。

作者：胡良平等.医学论文中统计分析错误辨析与释疑:实验设计类型的合理选择.中华医学杂志

搜索此博客

科研动力