前面说过定量资料分析方法的合理选择:难以直接辨析的实验设计的统计方法及常见错误辨析与释疑和 定量资料分析方法的合理选择:具有重复测量的设计的统计方法及常见错误辨析与释疑,本文介绍一下难以辨析的具有重复测量的设计的统计方法,并以实例的方式剖析错误发生的原因和解决方法。
难以辨析的具有重复测量的设计
在具体应用中,仅仅知道「重复测量」这个词是不够的,因为除了与「重复测量有关的因素」外,有时还有若干个与重复测量无关的因素,只有把实验所涉及到的全部因素之间的内在关系都弄得很清楚之后,找出哪些因素与重复测量有关、哪些因素与受试对象的分组有关但与重复测量无关,才能把相应的实验设计类型说得很清楚、很准确。换句话说,要能明确区分:什么是「具有一个重复测量的两因素设计」,什么是「具有两个重复测量的两因素设计」;什么是「具有一个重复测量的三因素设计」,什么又是「具有两个重复测量的三因素设计」等等。
因为具体情况不同,所选用的具有重复测量设计定量资料的方差分析方法是有所区别的。
误用t检验处理具有一个重复测量的三因素设计资料
例1 Gy 某种射线照射小鼠外周血白细胞数的动态变化研究
某人将40只小鼠随机地均分成4个组,用6.5Gy某种射线照射小鼠后,分别给予不同的处理,即第1组,空白对照;第2组,用rhIL-6;第3组,用rhG-CSF;第4组,用rhIL-6+rhG-CSF。每组小鼠均在照射后7、10、14、17、21、23d等6个不同时间点上被重复观测白细胞的数值,设计格式和资料见表1。
原作者误用t检验处理了该定量资料,试判断该资料所取自的实验设计类型。
对差错的辨析与释疑
在表1中,究竟涉及了几个实验因素?很多人都认为它涉及了两个因素,一个是「药物种类」,另一个是「照后时间」。其实,它涉及了3个实验因素,除照后时间外,纵向所列的4组是各有2水平的两个因素的4种组合,并非是一个药物因素的4个水平。
仔细观察不难看出,这个组合因素的4个水平就是由「rhIL-6不用与用」、「rhG-CSF不用与用」的4种组合。将这4种组合视为4个实验条件,每个实验条件下的10只小鼠在7个不同的时间点上被重复观测WBC的值,故与表1对应的实验设计类型应叫做具有一个重复测量的三因素设计。若将该表资料用表2的形式表达,则容易辨别出它所从属的设计类型。
例2 腹膜透析患者应用ACEI后对EPO疗效观察
该研究的目的是为了探讨终末期肾脏病行腹膜透析(PD)后的患者在服用血管紧张素转换酶抑制剂(ACEI)之后对促红细胞生成素(EPO)的疗效。方法为选择16例接受促红细胞生成素(EPO)治疗的腹膜透析(PD)患者,随机分成A、B两组。另外选择10名不接受EPO治疗的PD患者,随机分成C、D两组,A、C两组不接受血管紧张素转换酶抑制剂(ACEI)治疗,B、D两组还要同时接受ACEI的治疗。
测定实验前后每个患者血清EPO的浓度,结果以均数±s表示,统计学采用自身配对t检验及组间t检验。资料见表3。
对差错的辨析与释疑
本例的4个组是两个两水平因素的组合,1个因素是「是否接受EPO治疗」,另1个因素是「是否接受ACEI治疗」,他们都有两个水平,即「是」与「否」,相互组合成4个实验组,见表4。
每个受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,即试验前与试验后的数据并不是相互独立的,这种设计类型属于具有重复测量的实验设计,时间是与「重复测量」有关的一个试验因素。而采用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。
本例属于具有一个重复测量的三因素设计,应采用与之相对应的方差分析。通过分析,可以得到「是否EPO治疗」、「是否ACEI治疗」、「治疗前后」以及多项交互作用对EPO浓度的影响是否具有统计学意义。
难以发现的与重复测量有关的因素
例3 各用药组与对照组诱发后左右耳厚度差值比较研究
实验分组:为了研究丹皮酚治疗湿疹的作用,某人取60只小鼠,体重20~25g,分为6组,每组10只,将其全部致敏,左耳诱发皮炎,右耳作对照。Ⅰ、Ⅱ、Ⅲ组致敏和诱发阶段均用药,剂量分别为2、1、0.5mg/kg。Ⅳ组为生理盐水对照。Ⅴ组仅在致敏阶段用药,Ⅵ组仅在诱发阶段用药,剂量均为1mg/kg。诱发后24h处死小鼠,测耳中部厚度。统计学处理:用Student氏t检验处理资料,实验设计和资料列在表5中。
对差错的辨析与释疑
原作者用成组设计定量资料的t检验处理表5资料是十分错误的。在该表中,「组别」代表3层含义,即3个实验因素,其一为「丹皮酚的剂量」,其二为「致敏阶段是否用药」,其三为「诱发阶段是否用药」。而原文将3个实验因素全部列入「组别」之下,并用t检验将各组与Ⅳ组相比,用单因素设计思想取代了多因素设计思想,当然也就错误地选择了统计分析方法。
为了便于识别实验设计类型和选用统计分析方法,将表5中的6个组分别拆成2个组合,见表6和表7。
若用「(左-右)耳厚度差量」作为定量的观测指标,由表6可知,此资料所对应的实验设计类型为单因素4水平设计,由表7可知,此资料所对应的实验设计类型为两因素析因设计。如果资料满足正态性和方差齐性要求,可运用相应设计资料的方差分析处理资料,否则,需运用相应设计资料的非参数检验(如秩和检验)。
实际上,同一个动物的左、右耳的数据可以不相减,可以考察对左、右耳的影响是否对称。此时,与重复测量有关的因素就是左、右「部位」。对表6而言,就属于「具有一个重复测量的两因素设计」了;而对表7而言,就属于「具有一个重复测量的三因素设计」了。应选用相应设计定量资料的方差分析处理为宜。
例4 自体皮下移植成骨量的研究
某研究者在其论著中有如下的实验分组、资料表达和所选用的统计分析方法,试分析此文中资料表达和分析方面存在的错误。
实验动物:新西兰兔12只(已细胞取材),自体背部皮下移植,自身对照。无菌条件下,切开兔背部皮肤,潜行分离,于左、右皮下随机植入3种移植物。
实验分组如下:实验组:MCCAB,即松质骨基质2藻酸盐骨髓基质成骨细胞复合物,简称复合物;对照组1:藻酸-CBM,即藻酸盐2松质骨基质复合物;对照组2:CBM,即单纯松质骨基质。术后4周、8周取材,进行多项观察,每个时间点6只动物。统计处理:所得数据团体t检验。实验数据:主要实验数据见表8。
对差错的辨析与释疑
(1) 结果表达方面存在的问题:表8存在很多问题。
其一,纵、横标目放颠倒了,应将「实验分组(即植入时间)」放在左边,将「移植物种类」放在表头上,见表9。
其二,用标准误作为变异指标,容易掩盖资料呈偏态分布的真实情况,如表8中的3.17和3.06,若将他们还原成标准差,则分别是7.76和7.50,这两个数都比其前面的平均数大,表明这两组定量资料可能呈偏态分布,不宜采用表达正态分布资料的方式来表达,应选用M(QR)的方式表达定量资料[注:M为中位数,QR(=Q3-Q1)为四分位数间距]。
其三,表8标题中写着n=18,这是不妥的,因为总共只用了12只兔,n怎么可能为18呢?此处应写n=6,因为每个小组的数据测自6只兔,只不过从每只兔身上重复获得了3个数据,因此,严格地说,本例属于具有一个重复测量的两因素设计。
(2) 统计分析方面存在的问题:原文误用团体比较的t检验处理资料,从表9和实验设计可知,这是具有一个重复测量的两因素设计资料。本例中与重复测量有关的因素是什么?与重复测量有关的因素从表面上看是「移植物种类」,而从本质上看是动物的「部位」,因为是在动物背上3个不同位置上分别植入3种移植物。严格地说,「部位」与「移植物种类」之间发生了「混杂」,违背了实验设计的「均衡原则」。
正确的表格形式见表9,对资料作适当变量变换后若满足特定的前提条件,应选用具有一个重复测量两因素设计定量资料的方差分析方法处理资料为宜。
作者:胡良平等.医学论文中统计分析错误辨析与释疑:—定量资料分析方法的合理选择.中华医学杂志