面对一个具体的实验研究问题,究竟应该选择什么实验设计类型合适呢 ? 本文以实例的方式说明针对具体问题合理如何选用某种设计类型。
合理选用设计类型的指导思想
面对一个具体的实验研究问题,究竟应该选择什么实验设计类型合适呢?
首先应考虑拟考察的实验因素的个数、各因素的水平数以及是否要考察因素之间的交互作用;
其次应考虑必须加以控制的区组因素(即重要的非实验因素)的个数及其水平数;
第三应结合专业知识,考虑因素在施加时有无特殊要求,如「同时施加,还是分先后顺序施加」;同一个因素的各水平作用于受试对象时有无特殊要求,如「每一个受试对象只能接受因素的一个水平,还是可以接受因素的多个水平」;
第四应考虑实验者在经济、时间等方面的承受能力。
将以上4方面综合起来考虑,是针对具体问题合理选用实验设计类型的基本指导思想。
针对具体问题合理选用某种设计类型举例
1. 「成组、配对、交叉」设计中应选择哪一个
例1 已知某中药有一定的降血压作用,先打算通过动物实验了解该药的最适剂量。
研究者根据预实验的结果,拟采用A、B两种可能的剂量,并要求用猫作为受试对象。已知此药的持续作用时间小于6h,6h后血压又会恢复到原先的水平。根据先验知识和对结果的精度要求,按统计公式估算,每一组至少要用5只猫。
问:有哪几种可能的设计类型?其中最优者是哪一种?
分析与解答
设计1:由于该药有两个剂量A和B,故最简单的做法是将10只猫完全随机地均分成2组,1组给药剂量为A,另1组给药剂量为B,即采用「成组设计」。
设计2:我们还可以将10只猫按他们自身的条件,将性别、体重、年龄、健康状况、基础血压值等各方面都相同或接近的每两只猫配成1对,用随机的方法决定其中1只猫接受该药的A剂量,另1只猫接受该药的B剂量,即采用「条件相近者配对设计」。
设计3:若动物饲养中心能明确地区分每只猫所来自的窝别,也知道每只猫的年龄,那么,研究者在领取猫时,可以规定:全部猫的年龄要基本相同,从每一窝中取出2只「性别相同、健康状况和基础血压值等各方面都相同或接近」的猫配成1对,用随机的方法决定其中1只猫接受该药的A剂量,另1只猫接受该药的B剂量,即采用「同源配对设计」。将上述3种设计用表格的形式给出,以便比较,见表1。
上述3种设计都存在一个不足之处:动物的利用率低。因为只要两次用药时间间隔大于6h,可就在同一只猫身上使用该药的两种剂量各实验1次。于是,可以考虑下面的另外3种设计。
设计4:每只猫都先用该药的A剂量,后用该药的B剂量,时间间隔为8h,每次用药前后都测血压值,用其差值作为观测指标,即采用「自身配对设计」。
设计5:将全部10只猫完全随机地均分成2组,用随机的方法决定第1组5只猫使用该药两种剂量的顺序,如先A后B,则第2组中的5只猫使用该药剂量的顺序正好相反。每只猫两次用药的时间间隔为8h,每次用药前后都测血压值,用其差值作为观测指标,即采用「成组交叉设计」。
设计6:将全部10只猫按它们所具备的条件配成5对(配对条件越严越好,如同源配对),用随机的方法决定每一对中2只猫使用该药两种剂量的顺序,如其中1只猫使用该药剂量的顺序为先A后B,则另1只猫使用该药剂量的顺序正好相反。每只猫两次用药的时间间隔为8h,每次用药前后都测血压值,用其差值作为观测指标,即采用「配对交叉设计」。
将上述3种设计用表格的形式给出,以便比较,见表2。
设计类型点评
显然,后3个设计比前3个设计对动物的利用率提高了,作统计分析时「自由度」也增大了,其结论要相对可靠一些。但设计4(即自身配对设计)还是有问题的,对所有的猫来说,用该药的剂量都是先A后B,这样就人为地引入了「顺序误差」;设计5(即成组交叉设计)是比较好的设计方法,它可以将该药的A、B两个剂量的使用顺序所产生的影响分解出来;从对受试对象个体差异的控制角度来考察,设计6(即配对交叉设计)的效果应该是最好的。
2. 「单因素k水平设计、配伍组设计、拉丁方设计」中应选择哪一个
例2 已知某中药有一定的降血压作用,先打算通过动物实验了解该药的最适剂量。
研究者根据预实验的结果,拟采用A、B、C、D 4种可能的剂量,并要求用猫作为受试对象。已知此药的持续作用时间小于6h,6h后血压又会恢复到原先的水平。根据先验知识和对结果的精度要求,按统计公式估算,每个剂量组至少要用4只猫。
问:有哪几种可能的设计类型?其中最优者是哪一种?
分析与解答
设计1:由于该药有4个剂量,故最简单的做法是将16只猫完全随机地均分成4组,分别给予该药的不同剂量,即采用「单因素4水平设计」。
设计2:我们还可以将16只猫按他们自身的条件,将性别、体重、年龄、健康状况、基础血压值等各方面都相同或接近的每4只猫形成1个配伍组,用随机的方法将每一个配伍组中的4只猫分配到4个剂量组中去,即采用「条件相近者配伍设计」。
设计3:若动物饲养中心能明确地区分每只猫所来自的窝别,也知道每只猫的年龄,那么,研究者在领取猫时,可以规定:全部猫的年龄要基本相同,从每一窝中取出4只「性别相同、健康状况和基础血压值等各方面都相同或接近」的猫形成1个配伍组,用随机的方法将每一个配伍组中的4只猫分配到4个剂量组中去,即采用「同源配伍设计」。
上述3种实验设计也可以用表格的形式给出,其形式如表1类似,此处从略。这3种设计都存在一个不足之处:动物的利用率低。因为只要每两次用药时间间隔大于6h,就可在同1只猫身上使用该药的4种不同剂量各实验1次,于是,可以考虑下面的另外3种设计。
设计4:每只猫都用4次药,在每只猫身上用此药不同剂量的顺序均为A、B、C、D,每相邻两次用药的时间间隔为8h,每次用药前后都测血压值,用其差值作为观测指标。可以只用4只猫来完成此实验,即采用「具有一个重复测量的单因素设计」。
设计5:先将该药的4个剂量A、B、C、D随机化排成一个4行4列的方阵,如:
A B C D
B C D A
C D A B
D A B C
将全部16只猫按它们所具备的条件形成4个配伍组(配伍的条件越严越好,如同源配伍),将4个配伍组放置在上面4×4拉丁方阵的4行上,用随机的方法决定每一个配伍组中4只猫中的每一只接受该药的一个特定的剂量,而4列就是实验的顺序,每次用药前后都测血压值,用其差值作为观测指标,即采用「独立重复实验的4×4拉丁方设计」。
设计6:先将该药的4个剂量A、B、C、D随机化排成一个4行4列的方阵,如:
A B C D
B C D A
C D A B
D A B C
再将4只猫安排在4行上,其4次实验的结果便形成了一个配伍组,4列代表实验顺序,相当于第2个区组因素。每只猫相邻两次用药的时间间隔为8h,每次用药前后都测血压值,用其差值作为观测指标,即采用「含重复测量的4×4拉丁方设计」。
设计类型点评
显然,在上述的6种实验设计中,设计1最为简单,但对于重要的非实验因素未加任何控制,其结论的可靠性完全取决于「完全随机化」的效果,在各组样本含量都很大的条件下,完全随机化或许可以使重要的非实验因素在各组之间达到平衡一致;样本较小时,其效果就很难说了。
设计2和设计3都是采用「配伍组设计」,只不过是配伍的条件有「一般与较严」之分,配伍的条件越严越好,但在实际工作中较难实现。
设计4是不妥的,因为每只猫接受该药的剂量的顺序是一成不变的,这就必然会引入「顺序误差」。
设计5采用了「独立重复实验拉丁方设计」,使每一配伍组内的4只猫接受该药的不同剂量的顺序是随机的,它实际上是在前面设计2和设计3基础上作的一种改进,其缺点是没有减少样本含量。当然,在每次处理对受试者所造成的「创伤」严重的实验研究中,在同一个受试者身上不能接受2种或2种以上的处理,此时,就不得不使用这一设计或前面的设计2或设计3了。
在同一个体身上可以做重复实验的前提下,设计6是比较理想的设计类型,因为它不仅可以考察1个实验因素、2个区组因素,还对实验因素的水平进行了随机化,同时,又大大减少了样本含量。
3. 「析因设计、正交设计」中应选择哪一个
例3 在培养钩端螺旋体时,除了根据先验知识已固定若干因素外,拟研究以下4个实验因素取不同水平的效应,实验研究的目的是寻找四因素最佳的水平组合。
因素A(血清种类):A1(兔血清)、A2(胎盘血清);
因素B(血清浓度):B1(5%)、B2(8%);
因素C(基础液):C1(缓冲液)、C2(蒸馏水);
因素D(维生素加否):D1(加)、D2(不加)。
要求一:若需考察因素之间的各级交互作用,应选用什么设计类型?
要求二:若由预实验结果得知,只有A×B、C×D、A×B×D这3个交互作用是必需考虑的,其他交互作用项可忽略不计,此时,适合选择什么设计类型呢?
分析与解答
由题意可知,实验中涉及4个二水平的实验因素,按「要求一」可知,要考察实验因素的各级交互作用,此时,满足要求的惟一设计类型就是四因素析因设计,即将四因素的水平进行全面组合,共有2×2×2×2=16种,各种组合条件下至少要做2次或2次以上独立重复实验。其设计格式如表3所示。
按「要求二」可知,只有少部分交互作用项必须考虑,若仍采用上面的析因设计,将意味着要多做很多次不必要的实验。此时,比较明智的做法是选用合适的二水平正交表进行正交设计。那么,究竟应该选用什么样的二水平正交表呢?
显然,L4(23)正交表只有3列,是无法安排4个因素和3个交互作用项的;而L8(27)正交表虽然有7列,但在这7列里,也无法合理地安排4个因素和3个交互作用项,因为某些交互作用项会与单个因素所在的列重叠在一起,造成因素与交互作用项效应的混杂,这是无效的设计;看来比较可行的做法是选用L16(215)正交表,认真查阅其「对应的交互作用表」,或许能在15列中作出合理的安排,使单个因素的效应不与需要考察的3个交互作用项混杂。当然,对本例而言,选择L16(215)正交表,就等价于「未做重复实验的四因素析因设计」,因为4个二水平因素的全面组合总共只有16种。其表头设计见表4。
在表4中,为什么要把AB(即A×B)放在第3列上,把ABD(即A×B×D)放在第11列上,而把CD(即C×D)放在第12列上呢?这是查阅与L16(215)正交表对应的交互作用表才可以得到的,这个交互作用表见表5。
从表5中可以查得:第1列与第2列的交互作用出现在第3列上,第3列与第8列的交互作用出现在第11列上,而第4列与第8列的交互作用出现在第12列上。在这个表头设计的基础上,做实验时,只需要抄写安排单个因素的那4列,即第1、2、4、8列。
每行做1次实验(若实验重复起来不困难,人力和物力花费都不大,做2次或2次以上重复实验效果就更好了),共得16个实验数据,写在表6的最后一列。与表6对应的完整的正交表中还有8个空列派什么用场呢?他们将被用来估计实验误差的大小,等有了实验数据后,进行统计分析时,仍然只需将表6中的4列单个因素的水平代码和最后一列实验数据输入计算机,运用统计程序可以方便地分析4个因素以及3个交互作用项对实验结果的影响大小是否具有统计学意义。
作者:胡良平等.医学论文中统计分析错误辨析与释疑:实验设计类型的合理选择.中华医学杂志