在科学论文中,经常需要对统计资料进行表达和描述。但是统计资料的表达与描述也常发生不当或者错误的时候。本系统以实例的方式对统计资料表达与描述常见的错误进行辨析与释疑,以期为科学论文中如何对统计资料进行正确表达与描述提供帮助。此文是该系统的第二篇。
编制表格时主谓语颠倒
例1:用3种测度对楔状缺损形成因素的研究
在本项研究中,研究者考察的4种致损因素为:横刷牙、酸蚀、力疲劳和牙颈部结构类型。考察的3种缺损测度为:侧影深度、面积和缺损体积;3种测度为:一维测度:楔状缺损侧影深度(mm);二维测度:楔状缺损侧影面积(mm2);三维测度:缺损体积(mm3)。其结果列于表1中。
对差错的辨析与释疑
在表1中,「是否采取横刷牙」是实验分组因素,即统计表的主语,而3种测度实际上是3个定量的观测指标,即统计表的谓语。通常,将「主语」(即实验分组因素)放在统计表的左边,以「横标目」的形式出现,用以从左向右说明问题;将「谓语」(即观测指标)放在统计表的表头上,以「纵标目」的形式出现,用以从上向下说明表中数据的真实含义。
而原文作者在表1中正好将主语与谓语位置放颠倒了,不便于读者阅读。通常,表格的横标目代表某种「原因」,纵标目代表某种「结果」,这样从左向右阅读出来可以读成一句话,便于读者理解所要表达的意思。对表1进行修改,修改结果见表2。
其次,由表1可看出:原作者误用表达呈正态分布资料的方法表达呈偏态分布的定量资料,因为在表中有两组数据的标准差大于均数。「均数±标准差」是简单表达呈正态分布定量资料的一种形式,说明其数据分布的集中趋势和离散程度。当用此法表达定量资料时,若资料未经任何变量变换且有一定专业含义时,标准差不会大于均数。一旦超过,基本上可以认为这样的资料偏离正态分布较远,不适合用正态分布法表达这样的资料,建议改用M(QR)形式表达定量资料,其中M为中位数,QR为四分位数间距。
统计表中总的纵标目安排不当
例2:正颌外科计算机辅助诊断、模拟手术及面像预测系统准确性研究
原作者所在医院颌面外科进行正颌外科手术的牙颌面畸形患者31例,患者资料见表3。随访时间最短6个月,最长37个月,平均随访时间21.5个月。全部患者均以要求改善牙颌面畸形及功能就诊。
对差错的辨析与释疑
此表格设计不合理,该统计表中总的纵标目应当是「病例数」,而不应当是「性别」。表中的「性别」仅仅是其下方「男、女」的总称,但这个位置上应写出表中数据的真实含义,即「病例数」,表中写「病例数」的地方似应写「总病例数」。要使统计表达到「简单明了」的效果,将表3修改成表4的形式为宜。
纵横标目安排不当
例3:楔状缺损发生的位置及其相关因素的调查研究
原文作者对北京市462例中老年人进行了调查,并对其楔状缺损的相关因素进行了分析,资料见表5。
对差错的辨析与释疑
表5下部关于统计学处理的结果可以写在正文中。
该表中主要有以下3方面的错误:(1)表中数据含义未表达清楚,尤其是「%」代表的意义不明确;(2)舌侧楔缺义齿基牙患病比例和非义齿基牙患病比例相加为99.3%(属于计算错误所致);(3)纵、横标目位置放颠倒了。修改结果见表6。
统计表标目零乱、主谓颠倒、线条过多
例4:老年人慢性根尖周炎疗效分析
资料见表7~9。
对差错的辨析与释疑
在编制统计表时,总的纵标目应当是说明表中数据含义的关键词,细分的纵标目通常为第二分组标志。在表7~9中,可以清楚地看到:统计表标目零乱、主谓颠倒、线条过多等许多编制统计表时常犯的错误都出现了。
在表9中,表达了多项不同内容,使读者不易看出其本质,也不便于合理选择统计分析方法处理这样的统计资料。观测指标虽然都是不同条件下的「牙数」,但有两个彼此独立的三维表结构同时存在,这两个三维表又有两个定性变量是相同的,即「年龄分组(属于原因变量)」与「疗效分组(属于结果变量)」。另外,在表9中对同一批患者分别按「病变范围」与「治疗方法」分组,其总牙数应相等,但左边的总牙数为109,而右边的总牙数为108,这可能属于过失误差所致。与这3张表对应的修改后的统计表见表10~13。
作者:胡良平等.医学论文中统计分析错误辨析与释疑:统计资料的表达与描述之一.中华医学杂志
相关阅读