定量资料分析方法的合理选择:非平衡的多因素组合实验统计方法及错误辨析与释疑

前面说了定量资料如何合理选择统计方法及常见错误分析。临床科研中的问题往往都比较复杂,随机性很强。此时多需要进行非平衡多因素组合实验。如何对非平衡的多因素组合实验进行统计,避免发生统计上的错误,本文作一介绍。

何为非平衡的多因素组合实验

医学科研工作者往往希望自己的科研课题能回答较复杂的问题,复杂性体现在实验所涉及的影响因素较多。此时,实验条件控制起来比较困难,结果的随机性大为增加。

由于很多实际科研工作者缺乏多因素实验设计方面的知识,不知道事先制定完善的实验设计方案,因而未能对多因素进行科学合理地安排,仅凭自己的专业知识(有时全靠主观臆断),七拼八凑地构造出几个实验组和对照组。至于这些组一共涉及几个实验因素,各因素分别有几个水平,他们是全面组合还是有根据地部分实施,实验者却一概不知。

在没有明确实验设计理论和方法指导下稀里糊涂组合出来的实验,通常都属于「非平衡的多因素组合实验」。在这种组合实验条件下收集的定量资料,在很多情况下是无法直接进行统计分析的,因为它既不是单因素多水平设计的定量资料,也不是某种特定的多因素设计的定量资料。正确处理该资料的技术称为「拆分法」,即将多个组拆分成多种不同的组合,每一种拆分的结果是否合理,取决于专业知识和统计学知识。换句话说,任何一个合理的组合,就是各组之间在专业上有可比性,在统计学上又有一个标准的设计类型与之相对应。

误用t检验处理非平衡的多因素组合实验资料的实例

例:原文题目:『开胃理脾口服液对脾虚小鼠肠功能的影响』。

某研究者为了研究开胃理脾口服液对脾虚小鼠胃肠功能的影响,取70只小白鼠随机分为7组,每组10只,第1组为空白组,给等容生理盐水,其余各组给100%大黄水煎液1周(静脉注射,1次/d),造成脾虚模型。停食24h后,第1、2组静脉注射含有10%炭末的冷开水,第3~5组给含10%的炭末开胃理脾口服液,第6组给含10%炭末的开胃理脾丸剂,第7组给含有10%炭末的儿康宁。给药30min后处死小鼠,打开腹腔,剪取小肠,分别测量小肠总长度和炭末在肠内推进的距离,推进距离除以小肠总长度计算炭末推进百分率。各组具体剂量和推进率见表1。

定量资料分析方法的合理选择:非平衡的多因素组合实验统计错误辨析与释疑

原作者对各组数据采取成组设计定量资料t检验处理。实验表明,模型组与空白组比较,差异具有非常显著意义,开胃理脾口服液低、中、高剂量与模型组比较差异具有显著意义,提示本品具有促进小鼠小肠运动功能的作用,其作用强度较丸剂好。这样处理资料恰当吗?为什么?

对差错的辨析

很多作者简单地把表1资料视为单因素七水平设计定量资料,在实际进行统计分析时,又把它视为多个单因素两水平设计(即成组设计)定量资料,反复采用成组设计定量资料的t检验处理,这是很不正确的做法。

显然,在表1中「组别」一词所代表的内容是很多的,它既有受试动物「是否属于脾虚模型」,又有服用开胃理脾口服液的「剂量」,还有服用的药物剂型「是口服液还是丸剂」,甚至还有「是否服用药物(不服药、服开胃理脾药、服儿康宁)」。但在已做实验的7个组中,没有将前述的诸因素各水平之间全面组合,而只实施了其中的一部分。因此,本例中的「组别」所代表的因素属于「非平衡组合因素」。

不考查资料的实验设计类型,多次用t检验进行两两比较,根据概率计算原理,这样做会大大增加犯假阳性错误的概率。更严重的是:有些组之间比较时,在某些重要的非实验因素方面是很不均衡的,即组间缺乏可比性。就好比:将一组年轻的男性职业田径运动员与另一组60多岁的女性业余田径运动员比较100m短跑成绩一样,两组人之间没有任何比较的基础。

释疑:在实际分析时,可根据不同的分析目的,拆分成若干个组的不同组合,以便于识别设计类型和选用统计分析方法,这样得出的结论更合理可信。

本例可根据不同的分析目的拆成以下几种组合:

组合1:空白组与模型组:成组设计

组合2:模型组、低剂量组、丸剂组、儿康宁组:单因素4水平设计

组合3:模型组、中剂量组、丸剂组、儿康宁组:单因素4水平设计

组合4:模型组、高剂量组、丸剂组、儿康宁组:单因素4水平设计

组合5:模型组、低剂量组、中剂量组、高剂量组:单因素4水平设计

如果资料满足正态性和方差齐性,在上述5种组合中,组合1可用成组设计定量资料的t检验进行分析:后4种组合可视为单因素4水平设计,可运用相应设计定量资料的方差分析进行处理。否则,可运用非参数检验如秩和检验进行分析。对于后4种组合而言,若各组合下组间的差别经假设检验具有统计学意义,还可进一步采用Dunnett′s t检验分析其余各组与模型组之间差别是否具有显著意义。

例:原文内容摘要

试验分组:(1)对照组:对培养的细胞不经任何处理:(2)脂多糖(LPS)诱导组:向细胞培养液内加入LPS至终浓度1mg/L:(3)肝素组:向培养液内同时加入LPS和肝素,使终浓度分别为1mg/L和5mg/L:(4)LPS加1mg/L葡萄糖胺聚糖(GAG)组:向培养液内同时加入LPS和GAG,使他们的终浓度均为1mg/L:(5)LPS加5mg/LGAG组:向培养液内同时加入LPS和GAG,使终浓度分别为1mg/L和5mg/L:(6)LPS加10mg/LGAG组:向培养液内同时加入LPS和GAG,使终浓度分别为1mg/L和10mg/L。设计和资料见表2。统计学处理:结果用均数±标准差表示,采用t检验。结果和结论从略。

定量资料分析方法的合理选择:非平衡的多因素组合实验统计错误辨析与释疑

这样处理资料合适吗?为什么?

对差错的辨析

原作者误用t检验处理该资料不妥。因为该资料所对应的实验设计类型不是单组设计、配对设计,也不是成组设计。写在「组别」之下的6个组既不是单因素6水平设计,也不是两因素析因设计,它是一个非平衡的多因素组合实验资料

释疑:正确处理该资料的技术称为「拆分法」,即对「组别」之下的6个组进行拆分,形成多个不同的组合,每种组合所包含的各组在专业上具有很好的可比性,在统计学上又有一个标准的实验设计类型与之相对应,那么,这种拆分就是合理的。

结合上述的具体实验条件,可知「肝素组」实际上是「LPS(1mg/L)+肝素(5mg/L)」,于是可以列出如下的几种组合:

组合1:(1)、(2)组;成组设计

组合2:(2)、(3)、(4)组;单因素3水平设计

组合3:(2)、(3)、(5)组;单因素3水平设计

组合4:(2)、(3)、(6)组;单因素3水平设计

组合5:(2)、(4)、(5)、(6)组;单因素4水平设计

关于上述各组合的说明:组合(1)为成组设计,可以反映LPS「用与不用」之间的差别是否具有显著意义;组合(2)到组合(4)是平行的,都可以反映在加LPS的基础上,不加入任何物质、加肝素、加一种特定剂量的GAG所形成的单因素3水平对观测结果影响之间的差别是否具有显著意义;组合(5)是在加LPS基础上,有一个名为「GAG剂量」的因素分别取「0、1、5、10(mg/L)」四个水平所形成的单因素4水平设计。

两个定量观测指标在上述各组合条件下若分别满足正态性和方差齐性,则分别可采用成组设计资料的t检验、单因素多水平设计资料的方差分析,否则,需要运用秩和检验处理之;若在专业上有必要同时考察两个定量指标的变化,还可进行相应设计定量资料的二元方差分析

例:为了研究急性心肌梗死(AMI)和不稳定性心绞痛(UA)患者GMP2140和TXB2两项指标的动态变化情况,某人以门诊健康体检者为正常对照组,收集到表3资料,每个指标下都有11个组,原作者用一系列t检验将后面的10个组分别与第1组进行了比较得出结论。

定量资料分析方法的合理选择:非平衡的多因素组合实验统计错误辨析与释疑

这样做有什么不妥之处?正确的做法是什么?

对差错的辨析

在表3中,「组别」代表两层含义,即两个实验因素。其一为「心肌状态」,其二为「对心肌的观测时间」。由于这两个因素的各水平无法进行全面组合,故不便直接确定其实验设计类型。

在进行统计分析时,应将表3中的11个组分别拆成几种不同的组合,便于识别实验设计类型和选用统计分析方法,并且,其结果便于得出专业结论。

组合1:(1)、(2);成组设计

组合2:(1)、(3);成组设计

组合3:(2)、(3);自身配对设计(两组例数相等)

组合4:(2)、(3);成组设计(两组例数不相等)

组合5:(1)、(2)、(i);单因素三水平设计

组合6:(1)、(3)、(i);单因素三水平设计

组合7:(4)~(11);具有一个重复测量的单因素设计(各组例数相等)

组合8:(4)~(11);单因素8水平设计(各组例数不相等)

释疑:组合1与组合2分别表示正常组与心绞痛发作时的UA患者、正常组与心绞痛终止时的UA患者之间的比较,都属于「成组设计」。组合3、4是相同的,从本质上看,应属于自身配对设计,但当两组数据个数不等时只能近似按成组设计看待。组合5、6中的i代表(4)~(11)中的某一个,应根据临床专业知识选定,以便使各种组合条件下三组间具有更好的可比性,有利于得出明确的专业结论,他们都属于「单因素3水平设计」。组合7、8是相同的,从本质上看,应属于「具有一个重复测量的单因素设计」,但当各组数据个数不相等时只能近似按单因素8水平设计来看待。

如果资料满足正态性和方差齐性要求,在前6种组合和第8种组合条件下,可运用相应设计资料的t检验(对配对设计和成组设计而言)和方差分析。否则,需运用秩和检验。若各组合下多组间总的检验结果有统计学意义,在组合5、6条件下,还可进一步用Dunnett′s t检验(它不同于通常的t检验)分析其余各组与(1)组之间的差别是否具有显著意义。而组合7则属于具有一个重复测量的单因素设计,在要求不十分苛刻的前提下,可将其视为配伍组设计,应根据资料所具备的条件,选用相应的统计分析方法。若要求严格,应采用「具有一个重复测量的单因素设计定量资料的方差分析」处理组合7的定量资料为宜。

作者:胡良平.医学论文中统计分析错误辨析与释疑:定量资料统计分析方法的合理选择.中华医学杂志

  • 本博客文章如未特别说明,皆为本站原创,默认采用署名-相同方式共享 4.0 国际协议
  • 相关文章

    发表回复

    您的邮箱地址不会被公开。 必填项已用 * 标注