定量资料如何合理选择统计方法及常见错误分析

1 星2 星3 星4 星5 星 ( 5.00分 - 2 票)
  • A+
所属分类:研究方法

前面说过了定性资料如何合理选择统计方法及常见错误分析定性资料如何合理选择统计方法及常见错误分析之误用t检验和卡方检验 。现在就定量资料如何合理选择统计方法及常见错误分析作一叙述,并以实例的形式,针对原作者在对定量资料进行统计分析时所犯的错误,分析其出错的原因,并绐出正确的做法,展示统计分析方法合理选用的技巧。

定量资料

所谓定量资料的统计分析是指所观测的结果变量是定量的,而且希望考察定性的影响因素取不同水平时定量观测的平均值之间的差别是否具有统计学意义。

定量资料的统计分析有参数法与非参数法之分,一般来说,非参数法能解决的问题比较简单,其优点是对资料的要求(指资料应满足的前提条件)比较低。而参数法通常能处理多因素的定量资料。但对资料的要求较高。

合理选用统计分析方法处理定量资料的关键在于以下两点

一是准确辨析资料所对应的实验设计类型;二是检查资料是否具备参数检验的前提条件。

值得注意的是人们在对定量资料进行统计分析时常犯各种各样的错误(主要是忽视了前述两点所致),有些错误将直接导致得出错误的结论。因此,准确辨析定量资料统计分析中常见的错误是很有必要的。

由于医学专业上的要求,研究者常常需要研究不同因素组合下的实验效应,或观察不同时间点上的实验效应,因此就会不目觉地应用一些诸如析因设计、具有重复测量设计等相对复杂的实验设计类型。这些设计都有其对应的特点,数据分析时有其特定的统计模型,而研究者本人往往并不了解所采用的设计类型是什么,也不了解实验中究竟涉及几个因素、各因素分别有几个水平以及他们是如何组合的;不检查资料是否满足进行某种统计分析所要求的前提条件,只是一味地套用t检验进行两两比较,把t检腓为分析定量资料的「万能工具」,这就不可避免地造成丁t检验的误用和滥用。

医学实验设计的类型很多,常见的有:单组设计、配对设计、成组设计、配伍组设计、拉丁方设计、交又设计、析因设计、正交设计和具有重复测量的设计等。 不同因素及其水平的组合、实验的具体实施以及因素对观测指标影响的情况等决定了其设计类型。实际上适合用t检验进行平均值比较所对应的设计类型较少,只有单组设计、配对设计和成组设计3种。而且用t检验处理前两种设计类型的定量资料时资料应满足正态分布的要求:用t检验处理成组设计定量资料时。资料应满足正态分布和方差齐性的要求。

定量资料的统计分析在统计学运用中占有相当太的比重,误用的比例是非常高的,务必要予以足够的重视。

误将定量资料判为定性资料从而错误选用统计分析方法

例:原文题目『小儿皮肤血管瘤、孕激素受体的研究』,原作者意在探讨雌激素受体(ER)、孕激素受体(PR)在血管瘤发生、发展中的意义。采用兔疫组化方法对毛细血管瘤、混合型血管瘤、海绵状血管瘤、淋巴管瘤及正常皮肤组织的ER、PR进行检测。

全部标本经10%福尔马林固定,常规石蜡包埋。每例选一典型蜡块,4~6μm切片,进行免疫组化染色,高倍镜下每例肿瘤区内计数500个细胞,计数ER、PR阳性细胞百分率,资料见表1。统计方法用χ2检验

定量资料如何合理选择统计方法及常见错误分析

对差错的辨析

正确识别统计资料的性质是合理选择统计分析方法的重要前提。根据统计资料的性质,统计资料一般分为定量资料和定性资料两大类。所谓定量资料,是指从每个观察单位身上(针对此资料,其观察单位是病例标本)测得的指标是用具体的数值表示的,其又分为计量资料(可带度量单位和小数点,如:某人身高为1.73m)和计数资料(一般只带度量单位,但不可带小数点,如:某人脉搏为73次/min)。

所谓定性资料,是指从每个观察单位身上测得的指标仅反映某一方面的性质,并不能用具体的数值表示,其又细分为名义资料侦(如血型分为:A、B、AB、O型)和有序资料(如疗效分为:治愈、显效、好转、无效、死亡)。

对于本资料来说,测量细胞的结果是「阳性」或「阴性」,且一般认为带有「率」的资料就是定性资料,似应判为定性资料。然而问题的关键在于,原作者的观察单位并不是细胞本身,而是每一个病例标本,原作者关心的是4种疾病病例标本和一组正常人标本的ER、PR阳性细胞率之均值是否相同,从每一个病例标本中得到的是ER和PR阳牲细胞率,他们是具体的数值,因而应属于定量资料。

如果仅从资料的表面现象(有「率」)进行判断,而不考虑每一个数值的实际含义,没有从资料的本质上进行判断,很容易判断错误。

释疑:判断资料性质的关键是把资料还原为基本观察单位的具体取值形式,而不要被资料的表现所迷惑。本资料的受试对象为病例标本,测量指标为「阳性细胞百分率」,因而应为定量资料,其涉及一个实验因素,即样品类别。有5个水平,即:「毛细血管瘤」、「混合型血管瘤」、「海绵状血管瘤」、「淋巴管瘤」和「正常皮肤」。对于百分率的定量指标,一般根据经验,宜做平方根反正弦变换,当资料满足正态性和方差齐性的前提条件后,可采用单因素5水平设计定量资料的方差分析处理资料。若变量变换后仍不满足前提条件,则应采用非参数检验,如Kruskal-Wallis秩和检验。

忽视t检验和方差分析的前提条件

例:原文题目『血清肿瘤标志在结直肠癌诊断中的作用』。文章为研究CEA、CA19-9、CA72-4和CA242等4项肿瘤标志在患者手术前、手术后及转移复发方面差异有无显著意义,分别检测了58例手术前患者,30例手术后患者及19例转移复发患者,测量其4项指标,原作者对资料进行了t检验,资料见表2。

定量资料如何合理选择统计方法及常见错误分析

对差错的辫析

若资料中的数据均为正值且符合正态分布,通常其标准差要小于均值。本例中若干个单元格中标准差的数值是均值的2倍以上,基本上可以认为此资料服从偏态分布,不同组间标准差也相差悬殊,并不满足方差齐性的要求。作为参数检验方法J检验和方差分析有其应用前提条件,只有经过正态性和方差齐性检验,满足条件后才能应用。

本资料分了术前组、术后组及转移复发组,相当于一个因素的3个不同水平,从设计类型上判别应为单因素3水平设计的定量资料,原作者用了t检验进行分析,显然是错的。因为t检验仅适合分析单组、配对及成组设计的定量资料,并不适合分析单因素k(k≥3)水平设计定量资料和多因素设计定量资料。`

释疑:正态性和方差齐性假设检验的手工计算一般比较复杂,借助统计软件的相关模块或选项可以方便地实现计算。

若资料不满足参数检验的前提条件,可选用适合分析偏态分布资料的非参数检验(如秩和检验)进行分析,或找到满足前述两个前提条件的相应变量变换方法后,再用相应的参数检验法。因为实验设计类型为单因素3水平设计,可选用相应设计定量资料的方差分析进行处理。

误用成组设计资料的5检验分析配对设计的资料

例:原文题目:『盆腔动脉插管灌注化疗及栓塞治疗恶性滋养细胞肿瘤』。文章用改良的Seldinger’s插管技术对8例经临床及病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。治疗前后测血hCG放免测定值,资料见表3。

定量资料如何合理选择统计方法及常见错误分析

原作者采用一般t检验进行分析,治疗前后血hCG值经统样处理有差异显著意义(P < 0,05)。

对差错的辨析

本资料数据成对出现,每对数据测自同一个病例,因而为自身配对设计。对于此类资料,一般计算每对数据的差值,用其差值的大小,反映两种处理之间效应之差的大小。

原作者把治疗前后的数据当成是相互独立的数据,直接将治疗前与治疗后的数据按成组设计定量资料的t检验进行比较,这种处理方法与设计类型并不相符,容易增太犯假阴性错误的机会。

另外,原作者注意到原始数据不满足t检验的前提条件之一(即正态性),因而对其进行对数变换,这种思想是正确的,但是采取变量变换的目的还是使数据满足正态性,至于资料经过变量变换后是否满足了正态性要求,还应对变换后的数据进行正态性检验(注:此时应对两组数据分别取对数后相减,对其差值进行正态性检验),本资料取对数后计算差值,经验算资料仍然不满足正态性的条件,故不适合进行t检验。

释疑:对于配对设计的定资料,应计算各配对数据的差值,将资料转换为单组设计的定量资料,比较差值的平均值与0之间的差别是否具有统计学意义。当然进行单组设计的t检验前仍要对数据作正态性检验,如不满足正态性的前提条件,可寻找适当的方法(如取对数,平方根变换等)对数据进行变量变换,变量变换后还要进行正态性检验,若资料满足正态分布的前提条件,可用t检验。若资料仍不满足正态分布的前提条件,可采用非参数检验,如配对设计定量资料的符号秩检验进行分析。

误用配对设计资料的t检验处理单因素k(k≥3)水平设计的资料

例:原文题目:『莪术对大鼠在体子宫肌电活动的影响及其机制研究』。文章为观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,40只大鼠被随机分成4组,对照组:按10ml/kg鼠重灌服生理盐水,莪术组:按10ml/kg鼠重分别灌服25%、50%、100%莪术水煎液分成3组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。

原作者应用配对设计定量资料的t检验进行统计处理,资料见表4。

定量资料如何合理选择统计方法及常见错误分析

对差错的辩析

原文并没有交待将大鼠按体重等条件配伍到各个处理组中去,即大鼠在分人各剂量组之前,原作者并没有按某些重要的非实验因素对大鼠进行分组,因而不能直接相减作配对设计定量资料的t检验。

当然对此资料进行成组设计资料的t检验也是不对的,这是因为t检验最多只能分析单因素2水平设计、且满足「正态性和方差齐性」这样两个特定前提条件的定量资料。本资料有四个剂量,即代表剂量这个因素的四个水平,应属于单因素四水平设计的定量资料。

释疑:针对此种资料,如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用Dunnett's t检验(它不同于一般的t检验)将所有处理组均数分别与对照组均数进行比较,这样能够控制所有比较中最大的一类错误概率值不超过事先规定的检验水准α的值。如果在专业上有必要对3项指标同时进行考察,还应选用该设计下定量资料的三元方差分析对资料进行处理。

作者:李子建等.医学论文中统计分析错误辨析与释疑:定量资料分析方法的合理选择.中华医学杂志

weinxin
公众号
科研动力微信公众号,欢迎关注!

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: