定量资料分析方法的合理选择:具有重复测量的设计的统计方法及常见错误辨析与释疑

在生物医学实验研究和临床研究中,人们经常不自觉地做具有重复测量的实验。处理具有重复的测量设计的定量资料时方差分析方法显得要比处理其他非重复测量设计的定量资料时复杂得多,其复杂性主要体现在对资料的内部结构模式的研究和分析上,以消除数据之间存在的复杂相关性给统计分析所带来的不利影响。具有重复测量的设计的统计方法如何选择,如何避免常见错误?本文以实例的方式对具有重复测量的设计的统计方法及常见错误辨析与释疑进行说明。

什么是具有重复测量的设计

在生物医学实验研究和临床研究中,人们经常不自觉地做具有重复测量的实验。

例如有3种治疗某种疾病的药物,将全部该病患者随机地均分成3组,当他们服用某种药后,在若干个不同的时间点上对各药物组的患者重复观测某项或某些定量指标的数值大小,这就是所谓的具有重复测量的设计。

这种设计的一个突出特点是:各处理组中的受试者均在不同时间点上被重复观测,并且各观测点上的测定值具有不相等的相关性,即相邻点之间的相关性大、相隔越远的点之间的相关性越小。

相关性的存在使定量资料方差分析的一个前提条件(即独立性)受到了严重的破坏,因此,处理具有重复的测量设计的定量资料时方差分析方法显得要比处理其他非重复测量设计的定量资料时复杂得多,其复杂性主要体现在对资料的内部结构模式的研究和分析上,以消除数据之间存在的复杂相关性给统计分析所带来的不利影响。

另外「重复测量因素」有时是「对称部位」、有时是「若干因素的水平组合而形成的复合因素」。

误用t检验处理具有一个重复测量的三因素设计定量资料

例1 某人研究脑梗死组中不同的分子量的蛋白磷酸化情况,具体的结果如表1所示。

定量资料分析方法的合理选择:具有重复测量的设计的统计方法及常见错误辨析与释疑

原作者用t检验处理上表中所收集的资料,并将同一分子量和同一时间点上不同组别的数据用t检验进行比较。这样做错在哪?正确的实验设计类型是什么?

对差错的辨析与释疑

让我们来具体分析一下上面的资料所对应的实验设计类型是什么。原作者将受试对象分成了对照组和脑梗死组,在这样的基础上根据蛋白质的分子量的不同又分成了A、B两组,这里就涉及到了两个实验因素,另外原作者又在3个不同时间点上重复测定了每个样品的底物蛋白磷酸化放射活性,这里已经涉及到第3个实验因素,即「测定时间」。

值得注意的是:由于研究者在不同的时间点上对同一个体的样品进行了重复观测,所以,这是「具有一个重复测量的三因素设计定量资料」,其中「组别」和「分子量大小分组(即A组、B组)」是两个实验分组因素,「测定时间」是与重复测量有关的实验因素。我们将上面的表格作一个变换就比较容易看出其设计结构了,见表2。

定量资料分析方法的合理选择:具有重复测量的设计的统计方法及常见错误辨析与释疑

由此可以清楚地看出上述资料是具有一个重复测量的三因素设计定量资料,对此我们应该采取相应设计定量资料方差分析方法处理,而原作者只是简单地用t检验处理,很显然是不恰当的。

误用单因素多水平设计定量资料方差分析处理具有一个重复测量的两因素设计定量资料

例2 原文题目『尼莫地平对新生儿HIE治疗作用的研究』

为探讨尼莫地平对新生儿缺氧缺血性脑病(HIE)的治疗作用,将HIE新生儿43例,分为尼莫地平治疗组21例和对照组22例。治疗组于生后12h内开始使用尼莫地平口服治疗5mg/kg·d,其余治疗和处理与对照组相同,两组于生后12h、24h和72h检测RBCTCa和Ca2+i的含量。结果见表3。

定量资料分析方法的合理选择:具有重复测量的设计的统计方法及常见错误辨析与释疑

统计分析采用t检验和方差分析。显示对照组12h、24h,RBCT Ca和Ca2+i均高于治疗各时相组,差异具有显著意义(P<0101)。

结论:早期使用尼莫地平能阻止Ca2+内流,从而达到保护神经元、改善临床症状的作用。

对差错的辨析与释疑

「组别(本质上是「使用尼莫地平与否」」是一个「实验分组因素」,因为全部患儿被分成了对照组与治疗组;对于各组中的每一位患儿来说,同一个指标在3个时间点上分别被重复测量,说明「生后时间」这个因素是一个重复测量因素,因而这是具有一个重复测量的两因素设计定量资料。原作者采用单因素多水平设计定量资料的方差分析对资料进行处理是不妥的,因为t检验和一般的方差分析要求数据之间相互独立(即数据之间不存在相关性),而重复测量数据之间并不满足独立性的要求。况且,该定量资料所对应的实验设计类型既不是成组设计也不是单因素多水平设计。也就是说,无论从设计类型还是从资料所具备的前提条件来看,都不适合采用单因素多水平设计定量资料的方差分析处理该定量资料。

应采用具有一个重复测量两因素设计定量资料的方差分析对资料进行处理,如果不同时间点上测量值的差异具有显著意义,还可进一步做两两比较。如果RBCT Ca和Ca2+i两个指标在专业上有联系,还可以进一步做重复测量设计定量资料的二元方差分析,得到更概括性的结论。

误用t检验处理具有两个重复测量的两因素设计定量资料

例3 用贲门癌患者的标本制成液体,在3种不同处理条件下观测鸡胚背根神经节与鸡胚交感神经节中长出突起的神经节的比例。

现有贲门癌患者10例,将每人的标本均分成3份,分别给予3种不同的处理(因素A),即A1(加入100ng/ml神经生长因子)、A2(加入200ng/ml神经生长因子)和A3(单用贲门癌培养液);并对每种处理后的标本中的两种类型的神经节(因素B),即B1(背根神经节)与B2(交感神经节),观测长出突起的神经节的比例(Y)。设计格式和资料见表4。

定量资料分析方法的合理选择:具有重复测量的设计的统计方法及常见错误辨析与释疑

很多人采用t检验处理此类定量资料,那是错误的。该资料所对应的实验设计类型叫什么?

对差错的辨析与释疑

该资料所对应的实验设计类型显然不是成组设计,故用t检验来处理此类资料是错误的。那么,该资料所对应的实验设计类型究竟是什么呢?

每位患者的样品被均分成3份,用3种不同的方法处理,而经过处理后的样品又被观测两种类型的神经节,每个样品被重复观测了6次,这6次重复观测与两个因素的水平组合有关,故此实验所对应的实验设计类型被称为「具有两个重复测量的两因素设计」,应选用相应设计定量资料的方差分析方法处理此资料为宜。

误用t检验处理具有两个重复测量的三因素设计定量资料

例4 A ,B ,C 三个实验因素对大鼠心率影响

设第1个试验因素A(药物):A1(生理盐水)、A2(H303药,剂量012mg/ml)、A3(复方丹参片,剂量012mg/ml);区组因素S(大鼠);第2个试验因素B(处理):B1(给药)、B2(结扎冠脉前降支造成缺血);第3个试验因素C(时间,s):C1(0~1)、C2(3)、C3(5~10)。观测指标为心率(次/min),资料见表5。

定量资料分析方法的合理选择:具有重复测量的设计的统计方法及常见错误辨析与释疑

表中给出的是以0时刻为基准的相对心量资料,用t检验是不妥的。不难看出药物是一个「实验分组因素」,因为全部动物完全随机地被分成了3组,每组中的每只动物被重复观测了6次,这6次观测是在B、C两个因素水平全面组合条件下进行的,即在重复测量的方向上有两个因素,故此设计被称为「具有两个重复测量的三因素设计」,应选用与此设计对应的方差分析方法处理资料为宜。

误用t检验处理具有两个重复测量的四因素设计定量资料

例5 A ,B ,C ,D4 个试验因素对大鼠心率影响

设第1个试验因素A(药物):A1(H303)、A2(复方丹参片);第2个试验因素B(药物剂量,mg/ml):B1(012)、B2(2);区组因素S(大鼠);第3个试验因素C(处理):C1(给药)、C2(结扎冠脉前降支造成缺血);第4个试验因素D(时间,s):D1(0~1)、D2(3)、D3(5~10)。观测指标为心率(次/min),资料见表6。

定量资料分析方法的合理选择:具有重复测量的设计的统计方法及常见错误辨析与释疑

表中给出的是以0时刻为基准的相对心率。每一行中的6个数据重复测自同一只大鼠,很多人常误用t检验处理这样的定量资料,那么,该资料所对应的实验设计类型是什么?

对差错的辨析与释疑

这不是一个成组设计定量资料,用t检验是不妥的。

本例中,药物与剂量是两个「实验分组因素」,因为这两个因素的水平全面组合共有4种情况,形成4个独立的实验条件,全部动物被完全随机地分配到这4个组中去;每个组中的每只动物在另外6个不同的实验条件下被重复观测,形成这6个实验条件的是C和D两个因素的水平组合,故这个资料所对应的实验设计类型被称为「具有两个重复测量的四因素设计」,应选用与此设计对应的方差分析方法处理资料为宜。

作者:胡良平.医学论文中统计分析错误辨析与释疑:定量资料分析方法的合理选择.中华医学杂志

  • 本博客文章如未特别说明,皆为本站原创,默认采用署名-相同方式共享 4.0 国际协议
  • 相关文章

    发表回复

    您的邮箱地址不会被公开。 必填项已用 * 标注