在生物医学实验研究中,人们常被复杂的专业问题所困扰。由于缺乏解决某些多因素实验设计的技术和能力 ,不能将问题的「原型」正确地转变为统计学上的「标准型」,常被问题的「表面现象」所迷惑 ,经常作出错误的判断和分析。一旦定量资料所对应的实验设计类型属于这一类情形 ,就属于「难以直接辨析的实验设计类型」。难以直接辨析的实验设计类型如何选择合适的统计方法及避免常见的错误?本文作一介绍。
难以直接辨析的实验设计类型
在生物医学实验研究中,人们常被复杂的专业问题所困扰。由于缺乏解决某些多因素实验设计的技术和能力 ,不能将问题的「原型」正确地转变为统计学上的「标准型」,常被问题的「表面现象」所迷惑 ,经常作出错误的判断和分析。一旦定量资料所对应的实验设计类型属于这一类情形 ,就属于「难以直接辨析的实验设计类型」。
解决这个问题的关键就是要弄清实验的真实情况,将实验中所涉及到的全部因素及其水平组合梳理清楚,弄清因素在实验中是同时施加还是有先后顺序,弄清因素对观测指标的影响是地位平等还是有主次之分,当把这些情况都摸清楚之后,对原先的列表格式进行适当的变形,使实验设计的本质特征能得到充分地体现,以便使略有统计学常识的人都能看出实验设计的类型,这就是所谓的「结构变形」辨析法。
运用「结构变形」思想识别实验设计类型举例
例1:为探讨蛇毒抗栓酶(SVATE)作用的机制,某研究组在体外观察了SVATE对氧自由基损伤血小板的效应。研究分成4组,即对照组(用A表示):血小板悬液(PSS)37℃水浴15min;氧自由基(OFR)组(用B表示):PSS中含9.9×10-2mmol/L的HX和0.0016U/ml的XO,37℃水浴15min;SVATE组(用C表示):PSS中含0.03U/ml的SVATE,37℃水浴10min;SVATE+OFR组(用D表示):PSS中含0.03U/ml的SVATE,37℃水浴10min,再加入919×10-2mmol/LHX和0.0016U/ml XO,37℃水浴15min。温育后PSS离心,测定相应指标,结果以平均数±s表示,见表1。
原作者误将此资料视为单因素四水平设计定量资料,在处理资料时,又将其看作多个单因素两水平设计(即成组设计)定量资料,采用t检验进行分析。请辨析原作者犯了什么错误?
对差错的辨析与释疑
原作者犯错误的症结在于对「组别」一词的表面现象所迷惑,误认为「组别」就是一个实验因素,从而误认为A、B、C、D是该因素的四个水平。结合具体的实验可知:「组别」中实际上涉及到两个因素,他们分别是:「OFR用否(即「不用」与「用」分别为该因素的两个水平)」、「SVATE用否(即「不用」与「用」分别为该因素的两个水平)」。两者都不用时就是「A组(即对照组)」,仅用OFR时就是「B组(即OFR组)」,仅用SVATE时就是「C组(即SVATE组)」,两者都用时就是「D组(即SVATE+OFR组)」。
显然,做实验时,这两个因素要同时施加,而且没有充分的专业知识为依据认为两个实验因素何者对观测指标的影响大,即因素对结果的影响地位平等,故此时可判定这是一个两因素析因设计的定量资料,也可以叫做「2×2析因设计定量资料」。至于是一元的定量资料还是四元的定量资料,关键取决于需要同时考察的定量指标的个数。若某些定量指标在专业上不需要同时考虑,就属于两因素析因设计定量资料的一元分析问题;若某些定量指标在专业上有必要同时考虑,就属于两因素析因设计定量资料的多元分析问题。现以「微黏度(泊)」这个定量观测指标为例来说明两因素析因设计的两种正确的列表格式,以便使用者容易辨析其实验设计类型。两种正确的列表格式分别见表2和表3。
当资料满足「独立性、正态性和方差齐性」三个前提条件时,应采用「两因素析因设计定量资料的方差分析」;否则需要找到合适的变量变换方法使资料满足前提条件后再用此方法处理资料为宜。
例2:某研究者在其论著中有如下的实验分组、资料表达和所选用的统计分析方法,试分析此文中资料表达和分析方面存在的错误。
实验动物分组:在妊娠第12天,将妊娠母鼠随机分为4组:
A:正常对照组:12只,经腹部皮下给予0.1ml生理盐水。
B:地塞米松致畸组:12只,在妊娠第1214、1314、1414(天小时)连续经腹部皮下注射地塞米松磷酸钠生理盐水溶液,剂量为每次6mg/kg。
C:维生素B12致畸拮抗组:12只,该组动物除按地塞米松致畸组给药外,还在第1214、138(天小时)经腹部皮下注射维生素B12生理盐水溶液,剂量为每次0。2mg/kg。
D:维生素B12组:12只,在第1214、138(天小时)经腹部皮下给予维生素B12生理盐水溶液,每次0.2mg/kg,作为拮抗剂自身对照。
以上4组实验动物分别在1316、1416和1516(天小时)3个时间点以颈椎脱位处死母鼠,剖腹取出胚胎,在12倍体视显微镜下,用显微外科器械切取胎鼠腭突。观测多项定量指标的数值,并以平均数±s的形式表达,其中一个定量指标的结果见表4。
原文中陈述的统计学方法:实验结果采用单因素方差分析作各组间的方差分析和各组内不同时间点的方差分析、q检验,检测水准α=0.05。对C57BL/6j小鼠、空白对照分别与Dex组间作t检验分析,α=0.05。
对差错的辨析与释疑
(1) 结果表达方面存在的问题:表4给人的印象似乎实验中仅涉及一个实验因素,它有「A、B、C、D」四个水平,观测了三项指标,它们是「13d、14d、15d」。这纯粹是由于原文作者表达资料的错误给人带来的假象!其实该表只有一个定量的观测指标,即「膜联蛋白Ⅰ免疫印迹灰度扫描测量结果」;「A、B、C、D」所代表的4组并非是一个实验因素的四个水平,而是「地塞米松用否」与「维生素B12用否」两个因素各有两个水平组合后的结果,他们都有「不用、用」两个水平;该表中所写的「检测项目」其实仍是一个实验因素,即「作用时间」。
(2) 定量资料统计分析方法选用错误:显然,这不是一个单因素多水平的实验设计资料,而是一个三因素析因设计定量资料,因为该项实验研究涉及到「地塞米松用否」、「维生素B12用否」和「作用时间」三个因素,当没有足够的专业证据将这三个因素对观测结果的影响排出主次顺序时,该项实验设计类型就是三因素析因设计。原文作者误用单因素多水平设计定量资料方差分析处理该资料是错误的。该资料的正确表达形式见表5。
当资料满足「独立性、正态性和方差齐性」三个前提条件时,应采用「三因素析因设计定量资料的方差分析」;否则需要找到合适的变量变换方法使定量资料满足前提条件后再用此方法处理资料为宜。
例3:某人用t检验分析了表6资料,这是很不妥当的!因为它不是多个单因素2水平设计定量资料。试问:原作者错在哪?正确的实验设计类型是什么?
对差错的辨析与释疑
按表6的列表方式,使人不易看出实验设计的类型。像单因素八水平设计问题,又像是两个单因素四水平设计问题或是某种多因素设计问题。这是缺乏有关设计类型概念和知识的人们习惯的列表方式,在选用统计分析方法时起着严重的误导作用。
仔细看看以「药物」和「剂量」为总称的这两列。似乎该实验涉及了「药物」和「剂量」这样两个因素,事情是否果真如此?不妨试列出由他们组合成的表格,见表7。
显然,表7未全面、正确地表达表6所包含的信息,对照组的数据重复出现了,然而还有三组数据未包括进来,又无法反映出两种药合用的结果,故从原表中抽象出「药物」和「剂量」这样两个因素是不够正确的转换方式。事实上,原表中所反映的是两种药具有各自的用药剂量,故将「补肾药的剂量」和「Cy药的剂量」视为两个实验因素,问题就迎刃而解了,见表8。
由表8可以清楚地看出,原表中的八个组,其本质是分别具有两水平和四水平的两个因素的水平组合。由于每次实验都会涉及到两个因素的一种水平组合,即因素在实验中是同时施加的;没有充足的理由认为哪个因素对定量观测结果(即耳肿重量)的影响大,即因素对结果的影响地位平等,故这是一个两因素(或称2×4)析因设计,而不是单因素八水平设计,也不是两个单因素四水平设计问题。误用t检验或单因素多水平设计定量资料的方分析处理此资料都是错误的,其结论是不可信的。
当资料满足参数检验的前提条件时,应选用两因素析因设计定量资料的方差分析,否则,需要找到合适的变量变换方法使资料满足前提条件后再用此方法处理资料为宜。
作者:胡良平等.医学论文中统计分析错误辨析与释疑:定量资料分析方法的合理选择.中华医学杂志