实验设计类型的合理选择:正交实验设计合理选择及应用中存在的问题实例解答

1 星2 星3 星4 星5 星 ( 5.00分 - 1 票)
  • A+
所属分类:研究方法

正交设计是利用一系列规格化的正交表来安排多因素试验的一种十分有效的设计方法。在实验设计中如何合理选择正交实验设计,正交实验设计应用中存在哪些常见问题,本文以实例说明并给予解决方法。

什么是正交实验 设计

正交设计是利用一系列规格化的正交表来安排多因素试验的一种十分有效的设计方法。正交表是已经制作好的规格化的表,是进行正交设计的基本工具。正交表可分为同水平的和混合水平的两大类,常用的同水平正交表有2n型:L4(23)、L8(27)、L16(215);有3n型:L9(34)、L27(313)、;有4n型:L16(45)、L64(421)、;有5n型:L25(56)、L125(531)。常用的混合水平的正交表有:L8(41×24)、L18(37×21)、L50(511×21)等。Ln(Km)中的L代表「正交表」,n代表「正交表的行数」;K代表「各列的水平数」,m代表「列数」。

正交表各列水平代码出现的规律是:各列不同代码出现的次数一样多;任何两列不同代码组合形式出现的次数一样多,如(1,1)、(1,2)、(2,1)、(2,2)被称为4种不同的代码组合形式。满足这样两个条件的数据(或代码)阵列被成为是彼此正交的。由正交表所确定的「实验点(即正交表每一行代码所决定的实验条件)」具有两个明显的特点:在空间具有「均匀分散性」、在统计分析时具有「整齐可比性」。

正交表一般分成表头(列号)和表身(水平的标志)。所谓进行正交设计,实际上就是把实验因素及其交互作用合理地安排到正交表的表头中去。

正交设计应用中存在的问题

例1 浙贝母提取工艺的优化选择

原作者采用正交试验法考察提取溶媒、溶媒浓度、药材处理方法、提取次数等因素对总生物碱提取效果的影响。根据有关资料及经验,拟定7个因素,每个因素选择2个水平(表1),按L8(27)正交设计表对总生物碱提取和测定,结果见表2,方差分析见表3。

实验设计类型的合理选择:正交实验设计合理选择及应用中存在的问题实例解答

实验设计类型的合理选择:正交实验设计合理选择及应用中存在的问题实例解答

实验设计类型的合理选择:正交实验设计合理选择及应用中存在的问题实例解答

方差分析表明,提取溶媒对贝母碱的提取效果影响极显著,溶媒浓度、药材处理次之,提取时间、提取次数、粒度、溶媒量对结果几乎无影响。表2的结果表明,提取效果最佳的第4号(A1B2C2D2E2F1G1),即以95%乙醇提取3次,每次2h,碎粒提取,溶媒量6倍,药材不需10%Na2CO3处理。A1B2C2D2E1F1G2,即除溶媒9倍外,其余相同,但从表3看,溶媒量等对结果几乎无影响,可任取其一水平,从节约成本和时间考虑,选择最佳提取工艺为A1B2C2D2E2F1G1

对差错的辨析与释疑

正交设计是通过进行表头设计来实现的,通常先根据需要考察的因素数、水平数及交互作用的个数(以专业知识为依据),选择合适的正交表,每个因素的效应对应于正交表的一列,各因素的交互作用所在的列通过查所对应的交互作用表来获得,它对应于正交表的一列或多列上,此外,还需要空出若干列来,在方差分析时提供误差项用于统计分析。

原作者考察了7个因素,选用了L8(27)正交表进行表头设计,这样7个因素就把L8(27)正交表的7列占满,如果因素之间存在交互作用,其效应将会与某些单个因素的效应混杂,又因没有多余的空列,也就不能进行正确的统计分析,原作者将E、F、G三因素所对应的三列作为误差项,各因素的均方与误差均方相比得到F值(注:原作者误差的均方计算有误,应为误差的离均差平方和除以误差的自由度,此外,其他因素的离均差平方和也存在计算错误),从而判断各因素不同水平效应之间的差异是否具有显著意义,这种做法是不正确的。因为方差分析的思想是把数据变异的总的离均差平方和分解为各个因素的离均差平方和以及误差的离均差平方和,E、F、G三列的离均差平方和要么作为各个因素的离均差平方和,要么作为误差的离均差平方和,如果以此三列作为误差项,是不能分析出E、F、G三因素的效应的。

完善的正交设计要根据因素的个数、水平数及所考察的交互作用选用合适的正交表,通常在安排完各因素及交互作用所对应的列后,还要空出若干列来作为误差项。本资料可选用大一号的正交表即L16(215)正交表来进行表头设计,这样不仅可以考虑各因素的效应,而且还可以考虑部分因素的交互作用,留出若干列来作为误差项,可以使分析的结果更稳定。

例2 生脉颗粒剂的处方、工艺研究

作者所选用的因素和水平见表4,并运用L9(34)正交表安排了实验因素见表5.

实验设计类型的合理选择:正交实验设计合理选择及应用中存在的问题实例解答

因素对细粉率指标影响大小顺序为 B →C →A→D ,最佳处方工艺为A2B3C2D1 。因因素对稳定性指标影响大小顺序为为A →B →C →D,最佳处方工艺为A3B3C3D3 。综合考虑稳定性和细粉率的影响因素及各自的最佳工艺,并以稳定性为主,最终选定最佳工艺处方为A3B3C3D3,即 PVP 浓度5%、用量125ml ;乳糖-微晶纤维素-三硅酸镁(12:5:3) ;软材搅拌时间150s。

对差错的辨析与释疑

用L9(34)正交表安排可能有交互作用的四个实验因素,设计欠合理;正交表中四列全部排满,不便对资料进行统计分析,结论的可靠性较低。

正交试验设计是利用一套规格化的正交表来安排各实验因素及各水平。正交表很多,需要根据因素的个数、水平数、实验条件及因素间是否有交互作用来选取,本例有四个因素,选择L9(34)表,无法估计误差。此外,「PVP浓度与PVP用量」之间可能在交互作用,需要考虑。因此,应选择较大的正交表[如选择L27(313)表]安排四个实验因素及其交互作用(表6),并对资料进行方差分析为宜。

用L27(313)表安排四个实验因素和一级交互作用(即两个因素之间的交互作用)的个数小于等于3的表头设计见表6。

实验设计类型的合理选择:正交实验设计合理选择及应用中存在的问题实例解答

说明对于三水平因素来说,每一对交互作用占两列,如A×B占第3、4两列,在表头设计中分别用AB1和AB2表示。同理,可以解释AC1和AC2、BC1和BC2的含义。表身的水平编码可从专用统计工具表中查得,此处从略。做实验时,只需要将此表中与单个因素对应的那些列的水平代码抽出来,按各行水平代码所决定的实验条件去做实验,将得到的实验结果记录在各行的最后边,等全部实验都做完后,就可进行正交设计定量资料的方差分析。

正交设计的作用在于,用较少次数有代表性的试验点,获得尽可能多的信息,从而得出较为可靠的结论。由于正交设计具有「均匀分散、整齐可比」的特点,所以,某些好的实验点即使未包含在实验中,一般也能通过方差分析(特别是通过对交互作用的分析)将其寻找出来,这一点也是其他实验设计类型很难与其相比的优点。

例3 在某项生物医学实验研究涉及到了7个实验因素A~G

由预实验得知:C×F、G×F是相当重要的交互作用,必须考虑,但实验次数不能太多,最好不要超过35次。观测指标是某种物质的产量,每个因素拟考察3个不同的水平,希望通过较少次数的实验,找到因素之间的最佳水平组合。某研究者采用析因设计安排此实验,问此人的做法妥否?正确的做法是什么?

对差错的辨析与释疑

此研究者的做法是不妥的。因为实验中将涉及7个实验因素,每个因素需要考察3个水平,若用析因设计,则因素之间的全部水平组合数为37=2187,这仅仅是不同的实验条件数,各实验条件下至少要做两次独立重复实验,这样一来,总共至少需要做4374次实验。

做这么多次实验需要花费大量的人力、物力和时间,通常研究者是无法承受的!虽然要考察的实验因素比较多,但需要考察的交互作用却比较少,故完全没有必要进行析因设计,而改用正交设计,不仅可以很好地实现实验目的,还可节省时间、经费和人力。

具体地说,本实验研究适于选用3水平的正交设计。因为有7个三水平的实验因素,还要考察两对一级交互作用,实验次数又不能超过35次,故只有选用L27(313)正交表安排实验合适。此表有13列,7个三水平的实验因素要占去7列,两对一级交互作用要占去4列,共占用11列,故还剩下2个空列,可用于估计实验误差。这种正交表可从统计教科书或专用统计表中查到,这里只需给出表头设计就可以了(注:有些书上连表头设计都是现成的,只要能看懂,就可直接套用)。表头设计见表7。

实验设计类型的合理选择:正交实验设计合理选择及应用中存在的问题实例解答

值得一提的是,进行表头设计时,应首先安排需要考察交互作用项的实验因素及其交互作用,在剩下的空列上可随意放置不需要考察交互作用项的实验因素。

例4 有一项试验研究,涉及A、B、C、D四个因素,由专业知识得知,B与D之间的交互作用是不可忽视的。

全部因素拟取两水平,希望通过较少次数的试验和较易分析的方法确定最优的试验条件,有人选用正交拉丁方设计来安排此实验,妥否?若不妥,请选择合适的设计类型,并给出具体的设计格式。

对差错的辨析与释疑

此实验不适合选用正交拉丁方设计,因为虽然有4个因素,但这4个因素基本上都属于实验因素,尤其是还必须考虑因素B与因素D之间的交互作用,正交拉丁方设计无法完成此重任!若能承受较多的实验次数,可以考虑选用四因素析因设计,但题目要求:「通过较少次数的试验和较易分析的方法确定最优的试验条件」,故宜选用正交设计。具体地说,可选用L8(27)正交表来安排此试验,因为表中有7列,4个2水平实验因素占去4列,1个一级交互作用也只需1列就可安排,还剩2个空列,可用于估计实验误差。先安排需要考察交互作用的因素,后安排其他因素,其表头设计如表8所示。

实验设计类型的合理选择:正交实验设计合理选择及应用中存在的问题实例解答

例5 某项实验研究中涉及A、B、C、D、E五个三水平因素,已知A、C、E之间存在两两交互作用,希望试验次数较少,试验结果比较可靠,且易于统计分析。

某人试图用5×5的拉丁方设计来安排此实验,妥否?为什么?请运用合适的实验设计方法,拟定出具有可操作性的实验设计方案。

对差错的辨析与释疑

5×5的拉丁方设计可安排1个有5水平的实验因素,另两个都具有5水平的「区组因素(即重要的非实验因素)」,但这3个因素之间不应该有交互作用或交互作用可以忽略不计,现在的条件显然是不满足的!为了较好地实现题目中的要求,宜选用三水平的正交设计。

题中涉及5个三水平因素,3对一级交互作用,总自由度为(3-1)×5+2×2×3=22。若选用析因设计,至少需要做35×2=486次试验,显然,试验次数太多;若选用均匀设计,资料不便于进行统计分析,且结果不够稳定;而选用L27(313)正交表安排此实验,是可行的。因为此表共有13个3水平的列,共有26个自由度,而现在只需要22个自由度,尚有2个空列(因为还剩余4个自由度)可用于估计实验误差。若嫌误差项的自由度太小,可在此表的每行所规定的实验条件下做2次独立重复试验,总共也只需做54次试验。在利用此表进行表头设计时,应先安排需要考虑交互作用的因素及其交互作用,然后,在剩下的列中随意安排其他因素。所需的表头设计如表9所示。

实验设计类型的合理选择:正交实验设计合理选择及应用中存在的问题实例解答

每一对三水平的交互作用项占2列,如:A与C的交互作用出现在第3、4列上。表身的水平编码可从统计教科书中查到,具体实验前,应将第1、2、5、10、13列的水平代码抽出,转换成因素的实际水平,按各行水平组合进行实验。

作者:胡良平.医学论文中统计分析错误辨析与释疑:实验设计类型的合理选择.中华医学杂志

weinxin
公众号
科研动力微信公众号,欢迎关注!

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: