定性资料如何合理选择统计方法及常见错误分析

医学论文中常见定性资料的统计和分析,但是部分医学论文对于定性资料的统计方法选择不当,导致结果和结论不恰当或者欠足够的证据。对于定性资料如何合理选择统计方法,定性资料统计中常见的错误是什么?胡良平老师曾发过系列文章,本文作一总结。

定性资料

定性资料是指对每个研究对象的某些方面的特征和性质进行表达或描述所得的资料,其具体的取值要么是名义的,如血型 (A、B 、O、AB) 、职业 (工人、农民、军人、学生),性别(男、女) 等;要么是有序的或等级的,如疗效(治愈、显效、好转、无效、死亡),抗体滴度( + 、+ + 、+ + + 、+ + + + ) 等。

这些定性资料有些属于原因、有些属于结果,若将每个受试者的定性变量的具体取值全部列出,则不便看出资料之间内在的联系,故人们常以表格的形式对资料进行整理或归纳,这种表格被称为列联表。

例如临床资料中最常见的列联表如表 1 、表 2 和表 3 所示。

定性资料如何合理选择统计方法及常见错误分析

表 1 和表 2 中都只含有两个定性变量 (药物种类、疗效),因而叫做二维列联表,又因表 1 中的原始频数只有两行两列,故简称为 2 ×2 表或四格表。而表 2 中的原始频数占 3 行 4 列,故简称为 3 ×4 表,一般被简称为 R ×C 表。表 3 中含有 3 个定性变量(医院名称、药物种类、疗效),故被称为三维列联表,当列联表中定性变量的个数大于等于 3 时,一般被统称为高维列联表。

定性资料常用分析方法

1. 2 ×2 表资料的统计分析方法的合理选择

2 ×2表资料的统计分析方法取决于其设计类型,即横断面研究设计、队列研究设计、病例对照研究设计和配对设计四种类型。每种类型又需考虑一些具体情况,方可选择较为合适的统计分析方法处
理资料。

常用的方法有:一般χ2 检验、校正χ2 检验、Fisher精确检验。计算相对危险度 ( RR) 、计算比数比(OR) 、检验总体RR (或 OR) 与 1 之间的差别是否具有统计学意义的χ2 MH 检验。配对设计定性资料的 McNemarχ2 检验。

向您推荐我制作的EXCEL自动卡方检验及Fisher检验,不用自己再考虑是用普通卡方还是校正卡方了,输入数据就直接得出结果。

2. R ×C 表资料的统计分析方法的合理选择

R ×C 表资料的统计分析方法取决于表中两定性变量的性质和分析目的,按性质可将此类列联表分为以下四类:即「双向无序的 R ×C 表」、「结果变量为有序变量的单向有序的 R ×C 表」、「双向有序且属性不同的 R ×C 表」和「双向有序且属性相同的 R ×C 表」。

这些 R ×C 表资料,还需结合资料所具备的条件或分析目的,选择合适的统计分析方法,他们是:一般χ 2 检验、Fisher 的精确检验;秩和检验、Ridit 分析、有序变量的 Logistic 回归分析;秩相关分析或典型相关分析;线性趋势检验;一致性(或叫 Kappa) 检验或特殊模型分析。

3. 高维表资料的统计分析方法的合理选择

高维表资料的统计分析方法取决于表中定性变量是否能分出「原因和结果变量」,若分不出原因和结果变量,一般需要选用对数线性模型分析法。

若分得出原因和结果变量,则可分为以下 3 种情形:即结果变量为二值变量的高维表、结果变量为多值有序变量的高维表和结果变量为多值名义变量的高维表。

对于这些高维表资料,其统计分析方法有:多元Logistic 回归分析、对数线性模型;有序变量的多元Logistic 回归分析;扩展的多元 Logistic 回归分析。

定性资料统计分析方法合理选择的要领

我们认为对于定性资料的统计分析,可以遵循这样的思路

明确实验研究的专业目的;辨清实验中存在的影响因素和观测结果;要注意资料的收集方式与实验设计是否吻合,要注意实验设计的四个基本原则(随机、对照、重复、均衡)是否严格遵守;要注意列联表资料所对应的设计类型、资料所具备的前提条件、结果变量的性质和分析目的,在系统、全面地学习和掌握了常见的定性资料的统计分析方法之后,方可合理选用统计分析方法处理定性资料,最后还应注意检查结果解释和专业结论是否同时满足专业及统计学要求,千万不要将χ2检验视为处理定性资料的「万能工具」,千万不要作出含糊其词的解释和专业结论。

定性资料统计分析错误辨析与释疑

资料整理过失及误差和对资料类型判断错误导致错误的统计分析方法

原文作者研究非脱垂子宫切除微创手术在妇科的临床应用价值,表 4 为研究对象的基本情况

定性资料如何合理选择统计方法及常见错误分析

对差错的辨析与释疑

根据原作者在文字叙述部分介绍可知,表4中将总病例数写成 208 例,将子宫 > 8 孕周病例数写成 188例。将 TAH写成 TAHP,且该组中子宫 > 8 孕周病例数应为 182 例,而表 4 中却写成 112 例。如此多的过失误差出现在同一张表格中,是不应该的。

在该表格中记录的年龄这个变量,对于每一个研究对象而言,都可以得到一个精确量化的数值,应该是一个定量资料,若以组来概括表达,年龄应该用「x±s」的形式表达,不应仅写一个数据;更为不妥的是误用χ2 检验来分析表中后 3 组的年龄与第 1组(即 TVH 组) 的年龄之间的差别是否具有统计学意义。

另外在表 4 中,就子宫大小、腹部手术史的比较而言,原作者的用意让人感到困惑。因为该试验的目的是比较微创手术 TVH、LAVH、CISH 较常规剖腹手术TAH 优越 ,对于基本情况的比较应该是试图说明各组间在重要非处理因素方面均衡性好,组间的差异无统计学意义 ;而将各组与同为微创手术的 TVH 组比较,并不能说明微创手术组患者的基本情况与常规剖腹手术 TAH 组患者之间的差异无统计学意义,即所作的统计分析并不是原作者期望达到的目的。

定性资料例数很小时仍盲目套用χ2 检验或仅给出 P 值而缺少统计量的值,此时可靠性较差。

某作者试图「建立一氧化碳中毒所致迟发性脑病大鼠模型」观测大鼠中毒后表现和迷宫实验结果。

在 A、B 、C、D 4 组实验动物均为 10 只的情况下,又将 A、D 2 组动物在实验中的 5 个不同时间点上(第 3 、7 、14 、21 、28天) 分 5 批处死动物,每批每小组仅 2 只动物,最后再运用χ 2 检验进行 A、B 、C组动物的发病率的比较。

对差错的辨析与释疑

从实验设计角度看,各小组之间不仅在动物数目上缺乏可比性 (有些组有 10只,有些组只有 2 只)。而且在重要的非处理因素(如中毒的时间) 上不具有可比性,故这些均使得出的结论缺乏说服力。

在实验结果的表达中,使用的多为定性的描述,在统计分析部分虽交代采用了 t 检验和χ 2 检验,但在给出统计分析结果时未给出检验统计量的具体值,直接就写 B、C 二组与 A、C 二组比较差异无显著意义 ( P > 0 1 05),使人不能不对其 P 值的可靠性提出质疑。样本较小的定性资料的统计分析,一般不宜采用χ 2 检验,而应选用 Fisher 的精确检验来处理。

由于多方面的错误导致统计分析方法的误用

某作者对 TRT 组与对照组疗效进行比较,结论为 TRT 组疗效显着地优于对照组的疗效,资料见表 5 。

定性资料如何合理选择统计方法及常见错误分析

对差错的辨析与释疑

其一,原作者在收集和整理资料时违背了实验设计的要求,将原本属于「重复观测」的多因素定性资料错误地按「独立重复试验」方式进行收集和整理。因为两组患者中的每一位都在「第2 、6 、12 个月」被重复观察了 3 次,而且每次都按完全适应、基本适应、部分适应、未适应来给出疗效的评定,此时的「疗效」是「多值有序变量」。

其二,原作者将一个三维列联表资料简单地拆分成三个独立的二维列联表资料,割裂了整体设计,无法正确反映原因与结果之间的真正联系。

其三,对结果变量(疗效) 的有序性不予理睬,简单地将其分为适应与不适应两档(因为分析的是总适应率),采用无法利用结果变量有序性信息的χ2检验进行资料处理,其结论的可靠性大大降低(注 :表中 26 1 9 %为原文漏项) 。

本例最妥当的做法是严格按重复测量设计收集资料,并采用重复测量设计定性资料的统计分析方法进行统计分析。若一定要在错误收集资料的情况(表 5)下处理资料,应将其视为结果变量为多值有序变量的三维列联表资料,可选用有序变量的多元Logistic 回归分析方法处理之。

例  原作者展示了实验动物的切口愈合情况和感染情况,其中一部分实验结果列在表6中,其中甲、乙、丙分别代表切口愈合的等级,从甲到丙表示由优到劣。

定性资料如何合理选择统计方法及常见错误分析

对差错的辨析与释疑

原作者在文章中虽未明确提及所使用的统计分析方法,但从统计表底部的注释中我们可以看到,原作者采用的是在固定细菌浓度的条件下,比较实验组与对照组切口感染率之间的差别是否具有统计学意义,采用的是一般χ2检验。对于「感染与否」这个二值的结果变量来说,它受到组别(即实验组与对照组) 和细菌浓度两个因素的影响,应同时分析这两个因素对结果的影响,宜采用多元 Logistic 回归分析方法处理资料。

若希望排除细菌浓度的影响,重点考察实验组与对照组感染率之间的差别是否具有统计学意义,可以采用加权χ2 检验处理之。

然而,原作者对表 6 中切口愈合情况未作任何分析,未充分发挥现有资料的作用,实在有点遗憾。最好将表 6 资料按表7格式重新整理,然后选用结果变量为多值有序变量的多元 Logistic 回归分析方法进行处理为宜。

定性资料如何合理选择统计方法及常见错误分析

误用χ2 检验回答相关性问题

例:很多医学期刊论著中都采用χ2 检验处理类似表8的资料,其目的是希望回答表中「两个有序变量之间是否呈相关关系」。

定性资料如何合理选择统计方法及常见错误分析

原文用χ2 检验处理表 1 资料,得χ 2= 163.01,P < 0.005,结论为:可认为肺门密度与矽肺期次有关,结合本资料可见肺门密度有随矽肺期次增高而增加的趋势。

问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处 ?

对差错的辨析

因表8资料叫做「双向有序且属性不同的二维列联表资料」,对于这种资料的处理有3 个不同的目的。因此,也就对应着 3 套不同的统计分析方法。原文作者分析此资料的目的是「希望考察表中两个有序变量之间是否呈相关关系」,而χ2检验是检验「表中两个定性变量之间是否互相独立」,当检验的结果为拒绝「独立性」假设时,其对立的假设不是「相关」,而应当是「各矽肺期次的患者在3 种肺门密度级别上的人数分布是不同的」。

原作者误认为用χ2 检验拒绝了「独立性」假设后,其对立的假设一定是「相关」。事实上,从χ2检验的计算公式上不难看出,它与表中两个有序变量本身毫无关系,若将表中任何两行上的频数互换或将任何两列上的频数互换,它们所对应的χ2检验统计量的数值(本例为χ2= 163.01) 是不会变化的。显然,变换后的数据已预示其结论要发生变化,而χ2检验的结果却隐含着结论是不变的,这充分说明χ2检验用于处理由有序变量形成的二维列联表资料是不合适的。

释疑:结合表8的标题可知,若一定要根据χ2检验的结果作出结论的话,其结论应当是针对各行上的「频数分布」是否相同来作出明确的回答,而绝对不应当针对表中两个有序变量之间是否呈「相关关系」。要想对后者作出明确回答需要选用分析定性资料的相关分析方法,如:Spearman 秩相关分析,Kendall 秩相关分析或典型相关分析。

就上例言,若采用 Spearman 秩相关分析,得 : rs=0.53215,P<0.0001,结论为表中:两个有序变量之间呈正相关关系,即随着矽肺期次的增加肺门密度级别也逐渐增大,两者之间的相关关系具有统计学意义。

有人可能提出质疑,χ2 检验的结果不也得出了P < 0.005 的统计学结论吗 ? 若再具体计算其概率,很可能也会有P<0.0001的统计学结论,因为本例χ2= 163.01 相当大。一点不错,若根据χ2 检验的结果,本例也的确可以得出P< 0.0001的统计学结论,但这纯粹是一种「巧合」,无论其概率多么小,其专业结论也只能回答表中各行上频数分布是否相同,而不能回答表中两个有序变量之间是否呈相关关系。若将表8资料换成表9资料,两种计算方法之间的差别一下就显现出来了。

定性资料如何合理选择统计方法及常见错误分析

统计分析的目的是考察表9中两个有序变量之间的相关关系是否具有统计学意义,则:其一,若采用错误的统计分析方法 (即χ2检验),得:χ 2= 503.776, P <0 .0001,错误的专业结论为:矽肺期次与肺门密度级别之间的相关关系有统计学意义。该检验方法对应的正确的专业结论为:表9中各行上肺门密度级别的人数分布不同,具体地说:矽肺 Ⅰ期的患者多数肺门密度级别为「+」级、矽肺 Ⅱ期的患者多数肺门密度级别为「+ + 」级和「+ + +」级,而矽肺 Ⅲ期的患者多数肺门密度级别为「+」级和「+ + 」级。

其二, 若选用正确的统计分析方法 ( 如Spearman 秩 相 关 分 析), 得 : rs = 0.00059, P=0.9856,正确的专业结论为:表9中两个有序变量之间的相关关系没有统计学意义。

例:文献和很多医学期刊论著中都套用χ2 检验处理类似表 10的资料,计算所得的χ2= 24.639, P<0.005,得出的专业结论为「依沙酰胺治疗皮肤真菌的疗效与病程有关」的专业结论。试问这样做错在哪 ? 正确的统计分析方法和专业结论是什么 ?

定性资料如何合理选择统计方法及常见错误分析

对差错的辨析

表 10看上去好象与表8不同,但本质是相同的,即也是双向有序且属性不同的二维列联表资料,若希望考察表10中两个有序变量之间的相关关系是否具有统计学意义,用χ2 检验是错误的,宜选用定性资料的相关分析方法

释疑:若用 Spearman 秩相关分析,得 : rs = –0.21479, P<0.0001,专业结论为:依沙酰胺治疗皮肤真菌的病程与疗效之间有负相关关系,即病程越长疗效越差,表 10中两个有序变量之间的相关关系有统计学意义。

对于表10资料,若希望考察不同病程的患者疗效之间的差别是否具有统计学意义,也是值得回答的问题。此时,就应将此表视为结果变量(即疗效)为有序变量的单向有序的二维列联表了,这实际上是不考虑原因变量(即病程) 的有序性,而特别强调结果变量(即疗效) 的有序性。

为了实现此分析目的,可供选用的统计分析方法有:秩和检验、Ridit 分析和有序变量的 Logistic 回归分析(较复杂,一般不选用此法)。本例若选用秩和检验,得:Hc = 23.144, P<0.0001,专业结论为:各病程组患者的疗效之间的差别具有统计学意义,将各组秩和的平均值代入近似的 t 检验,进行两两比较,得结果为:设1 组为不满 1个月、2 组为 1 至 3 个月、3 组为 3 个月至 5 年、4 组为 5 年以上,则:

定性资料如何合理选择统计方法及常见错误分析

由于表10 中的疗效由「痊愈到无效」,且计算时「痊愈」档打分低,「无效」档打分高,故各病程组的平均秩小者疗效较好,由此可知:病程不满 1 个月与 1至 3月的患者的疗效之间的差异无统计学意义;病程 3 个月至 5 年与 5年以上的患者的疗效之间的差异无统计学意义;其他任何两种病程的患者的疗效之间的差异都有统计学意义,且病程短者疗效好。

误用秩和检验取代χ2 检验或 Fisher 精确检验

例:某研究者在其论文中运用秩和检验处理表11资料,选此方法处理该资料是错误的,这是为什么 ? 分析此资料的正确统计分析方法是什么呢 ?

定性资料如何合理选择统计方法及常见错误分析

对差错的辨析

原作者将表 11 资料视为结果变量为有序变量的单向有序的二维列联表资料,因而错误地选用了秩和检验。事实上,食管癌 TNM分期这个有序变量是「原因变量」,不是「结果变量」,不适合选用秩和检验处理此资料。

释疑:那么,正确处理表 4 资料的统计分析方法究竟是什么呢 ?

先将表 11变成表 12的形式,便可很容易认出它是一个什么样的二维列联表资料。因而,合理选用统计分析方法就显得是十分简单的事了。此时,不难看出 :表12资料为结果变量为二值变量(即阳性、阴性) 的二维列联表资料,虽然原因变量(即 TNM 分期) 是有序的,但其本质与双向无序的二维列联表资料是一样的,故当表11中记录6个观察频数的位置上小于 5 的理论频数的个数不超过总格子数的 1/ 5 (6/ 5 = 1.2) 时,可以选用一般χ2检验处理此资料。反之,需要选用 Fisher 的精确检验法计算概率。

定性资料如何合理选择统计方法及常见错误分析

本例「阴性」列 3 个格内的理论频数都小于 5 (占总格子数的 1/ 2),故宜选用 Fisher 的精确检验处理此定性资料。本例 Fisher 精确检验的结果为 : P = 0.0172,专业结论为:TNM 的 3 种分期的样品表达的阳性率之间的差异具有统计学意义,两两比较的结果为 : Ⅱa 与 Ⅱb 的阳性率之间的差异无统计学意义( P>0.05) 、Ⅱb 与 Ⅲ的阳性率之间的差异无统计学意义( P > 0 .05) 、Ⅱa 与 Ⅲ的阳性率之间的差异有统计学意义 ( P<0.05), Ⅲ期表达的阳性率明显高于 Ⅱa 期表达的阳性率 (注 :总例数和各组例数都较少,结论的可信度较低) 。

定性资料等级相关分析的相关方向错误

例 :某研究者对表13资料进行了 Spearman 秩相关分析,得到的结果为 : rs=0.601, P<0.05,得到的专业结论为:环氧合酶 (COX-2) 含量与诱导型一氧化氮合酶 (iNOS) 含量之间存在的相关关系具有统计学意义,这个计算结果和结论对吗 ?

定性资料如何合理选择统计方法及常见错误分析

对差错的辨析

虽然原作者所选用的统计分析方法是正确的,但计算结果却是错误的,两个有序变量之间的相关方向也是错误的,因而得出了错误的结论。

释疑:正确的计算结果为 : rs = – 0 .09236, P=0 .6212,正确的专业结论为 :环氧合酶 (COX- 2)含量与诱导型一氧化氮合酶 (iNOS) 含量之间不存在具有统计学意义的相关关系。在对两有序变量之间进行秩相关分析时,务必要注意给定性变量各等级赋值的顺序。本例若将「COX -2」按由上到下分别赋为「1 、2 、3」的值,将「iNOS」按从左至右分别赋为「1 、2 、3」的 值, 则计算结果就是正确的, 即 r s = –0.09236, P = 0.6212 ;若将这两个有序变量中的一个赋值方向弄反了,则计算结果为 : rs = 0.09236,P= 0.6212。若将这两个有序变量的赋值方向全部与前述第一种方向相反,那也没有关系,不会影响结论的正确性。

采取简单压缩的方法将三维表降为二维表

很多医学期刊论著中都采用简单压缩的方法将三维列联表降为二维列联表,例如有人觉得不便用一般的χ2 检验处理表 14资料(因为它包含3个定性、变量,即接受护理地点、产前护理量和婴儿存活状况),故设法将接受护理地点这一定性因素消除掉,使之仅包含产前护理量和婴儿存活状况两个定性变量,以便采用一般χ2检验处理之。

定性资料如何合理选择统计方法及常见错误分析

他们采取的方法是:将来自两个地点的接受护理量少与接受护理量多的数据分别合并,使一个原本属于「结果变量为二值变量的三维列联表资料」变成了一个「四格表资料」,简单合并后的数据见表15,采用一般χ2 检验对表15资料进行统计分析,得到的结果为:χ2=5.256, P=0.0219,专业结论为:孕妇在产前接受护理量少者其所生婴儿的死亡率明显高于孕妇在产前接受护理量多者其所生婴儿的死亡率,两个死亡率 (分别为 5.089%与1.863%) 之间的差异具有统计学意义 (χ2=5.256,P=0.0219) 。这样做对吗 ? 其结论可信吗 ?

定性资料如何合理选择统计方法及常见错误分析

对差错的辨析

上述压缩的方法称为简单压缩,仅当被压缩掉的定性变量与保留下来的定性变量之间是互相独立时,这种简单压缩才不易导致错误的结论,否则,很可能会得出错误的结论来。

释疑 :判断上述简单压缩的结论是否正确的简便方法是计算「比数比 ( OR) 」,若各分表 (皆为四格表) 的 OR与合并后四格表的 OR 值接近,则采取简单合并法处理资料问题不太大。本例 :

定性资料如何合理选择统计方法及常见错误分析

这两个 OR 值都比较接近于 1,对 O R = 1.249检验 H 0 : 总体 OR = 1 、H 1 : 总体 O R ≠1,得 P =0.773;对 O R = 0.992 检验 H0:总体 OR = 1 、H 1:总体 O R ≠1,得 P = 0 1 992 。故可认为:孕妇接受的产前护理量与婴儿存活状况之间的交互作用无统计学意义,即婴儿存活状况与孕妇产前接受护理量多少无关。

但是,当我们计算一下表15资料中的 OR 值,并对其进行假设检验,结果如下。

对压缩后的资料而言 : OR =ad/bc=20 ×316/373 ×6=2.824

此时, OR 与 1 之间有较大的差距,若对 OR =2.824 检验 H 0 :总体 OR = 1 、H 1 :总体 O R ≠1,得 P=0.022 。说明由表15资料应得出「孕妇接受的产前护理量与婴儿存活状况之间的交互作用有统计学意义」的结论来,即「婴儿存活状况」与「孕妇产前接受的护理量多少」有关,接受护理量多者其所生婴儿的死亡率明显降低。

上述两种分析方法得出了截然相反的结论,究竟谁对谁错 ? 答案是后者(简单压缩法) 错了 ! 因为被合并掉的「孕妇接受护理地点」(原因变量之一)与「孕妇接受护理量多少」(原因变量之二) 、「婴儿存活状况」(结果变量)之间都不独立,在这种情况下,是不适合通过简单合并方式来消除「孕妇接受护理地点」(原因变量之一) 的影响的。

说明这一结论正确性的最好方法是采用「对数线性模型」处理表 14 资料,设 a 代表「婴儿存活状况」、b 代表「孕妇产前接受的护理量多少」、c代表「孕妇接受护理地点」,运用国际上著名的统计分析系统 SAS 软件中的 CATMOD 过程进行对数线性模型分析,其主要结果概括如下 :

1.  包含 a、b、c、ab、ac、bc、abc 的饱和模型的计算结果:显示 c、ab、abc无统计学意义,但对整个模型无法进行假设检验,因为没有误差项了,故不便作出明确评价。

2. 包含 a、b、c、ab、ac、bc 的非饱和模型的计算结果:显示 c、ab无统计学意义。对整个模型进行模型与资料是否吻合的拟合优度假设检验的结果为:似然比统计量的值 = 0.04,自由度=1, P=0.8352,故可以认为此模型对资料的拟合优度较好,但由于模型中还包含无统计学意义的项,特别是包含ab这个无统计学意义的交互作用项,需要进一步寻找更好的模型。

3. 包含 a、b、c、ab、ac的非饱和模型的计算结果:显示c无统计学意义。对整个模型进行模型与资料是否吻合的拟合优度假设检验的结果为:似然比统计量的值=188.12,自由度 =2, P<0.0001,故可以认为此模型对资料的拟合优度很不好,需要进一步寻找好的模型。

4. 包含 a、b、c、ab、bc 的非饱和模型的计算结果显示模型中的各项均有统计学意义。对整个模型进行模型与资料是否吻合的拟合优度假设检验的结果为:似然比统计量的值=12.22,自由度=2, P=0.0022,故可以认为此模型对资料的拟合优度不好,需要进一步寻找好的模型。

5. 包含 a、b、c、ac、bc 的非饱和模型的计算结果:仅显示c无统计学意义。对整个模型进行模型与资料是否吻合的拟合优度假设检验的结果为:似然比统计量的值=0.08,自由度=2, P=0.9597,故可以认为此模型对资料的拟合优度相当好,虽然模型中还包含无统计学意义的 c项,但比它高阶的项 (如ac、bc) 都有统计学意义,c 项是不能从对数线性模型中去掉的 !

其他几个更简化的模型经过计算其结果都很不理想,故认为模型(5) 是最适合表14资料的对数线性模型了。

由以上的计算过程和主要结果可知,变量 c (即孕妇接受护理地点) 与变量 a (婴儿存活状况) 和变量 b(孕妇产前接受的护理量多少) 之间都是互相不独立的,因此,不能通过简单合并的方法将其消除掉,简单消除后计算所得出的结论是错误的 !

本例的正确结论应当是什么 ? 从对数线性模型的结果似乎不能明显看出,若采用加权χ2 检验和MHχ2 检验消除「接受护理地点」的影响,着重考察「接受护理量少」与「接受护理量多」两种条件下「婴儿死亡率」之间的差别是否具有统计学意义,可得到如下的结果 :

① 回答产前护理量少与多的婴儿死亡率之间的差别有无统计学意义的加权χ2 检 验χ2加权 =0.039, P = 0.8434,专业结论为:产前护理量少与多两条件下婴儿死亡率之间的差别无统计学意义。

② 计算产前护理量少相对于多的 OR 值及其假设检验采用 MHχ2 检验 OR = 1.114,χ2MH =0 .039, P = 0.8434 (注 :与加权χ 2 检验公式略有区别,因保留位数较少,差别不易体现出来),专业结论
为:总体 OR 值与 1 之间的差别无统计学意义,说明产前接受护理量少相对于接受护理量多的孕妇所生婴儿的死亡率并不会明显增大。

将高维表拆分成多个二维表用χ2 检验来处理

一项有关乳腺癌患者 3 年存活情况的调查研究,收集到的资料如表16所示。

定性资料如何合理选择统计方法及常见错误分析

各变量及相应的分类如下:

变量 1 (A) :患者被确诊的中心 : (1) 东京 ;(2) 波士顿 ; (3) 格拉摩根

变量 2 (B):诊断时患者的年龄(岁) : (1) 低于 50( < 50) ; (2) 50~69 (50~) ; (3) 70 岁以上(70~)

变量 3 (C):慢性炎症反应的程度 : (1) 轻度 ; (2)中等痛苦(中度)

变量 4 (D):核的量级 : (1) 相对恶性症状 (恶性) ; (2) 相对良性症状(良性)

变量 5 ( Y):患者存活 3 年以上 : (1) 不是 (死) ;(2) 是(活)

在医学期刊论著中,我们经常可以看到人们将表16资料拆分成 18 个四格表资料,运用一般χ2 检验(和/ 或 Fisher 精确检验) 对资料进行统计分析,这样做对吗 ? 为什么 ? 正确的做法是什么 ?

对差错的辨析

通常人们处理表16资料的做法是错误的!将表中前 4 个定性变量进行人为分层,有些层中例数又很少,不能正确地显示问题的本质特征,其计算结果是不可信的 ! 又因为它没有同时考虑多个定性影响因素及其交互作用项对观测结果的影响,因而反映的问题是十分片面的,甚至是错误的。

释疑:对于这样的资料正确的处理方法是什么呢 ?

首先应弄清这是一个什么样的列联表资料,显然,这是一个五维列联表资料,具体地说,应叫做「结果变量为二值变量的五维列联表资料」。处理这种资料可供选用的统计分析方法有两种。

其一,对数线性模型,用此法是比较复杂的,要想寻找到最佳的模型,非下大功夫不可。

其二,采用多元 Logistic 回归分析模型,用此法也需要下点功夫方可获得较为理想的计算结果,不仅考察了 4 个定性的原因变量、还同时考察了多个交互作用项对观测结果变量的影响,获得了较为满意的计算结果,因篇幅所限,在此不便赘述,感兴趣者可查阅该文献,尽享用多元统计分析方法解决复杂问题所带来的乐趣。

作者:胡良平等. 医学论文中统计分析错误辨析与释疑--定性资料分析方法的合理选择系列文章. 中华医学杂志

继续阅读:定性资料如何合理选择统计方法及常见错误分析之误用t检验和χ2检验

  • 本博客文章如未特别说明,皆为本站原创,默认采用署名-相同方式共享 4.0 国际协议
  • 相关文章

    定性资料如何合理选择统计方法及常见错误分析》有一个想法

    发表回复

    您的电子邮箱地址不会被公开。 必填项已用 * 标注