如何才能做好医学文献统计问题分析?

医学期刊文献中常见的统计学问题分析

       医学统计学是医学科学研究的重要手段, 医学科研论文中研究结果需要经过正确的统计学分析,才能体现科研结果的逻辑性和科学性。

       随着现代医学和统计学的发展,越来越多的医学期刊编辑和论文作者也意识到了统计学的重要性。

       然而,在现有的医学期刊中统计学错误的痼疾仍然存在,如实验设计不够严谨,误用、滥用统计方法等现象比较严重。

       本文就医学期刊论文写作中存在的常见统计学问题进行分析, 旨在探讨规范, 提高医学研究人员的统计学水平和科研水平,保证医学科研论文的学术质量。

1. 数据来源与方法

1.1. 资料来源

       收集、整理2014年1~12月医学期刊自由来稿的初稿文献,剔除其中综述、临床病例报告等不需统 计学处理的文章, 选取其中关于患者治疗疗效,临床用药及诊断方法比较,动物、细胞实验等方面的稿件共322篇作为分析资料。

1.2. 分析方法

       按照“中华医学会系列杂志审读中对科研设计与统计学方面的要求”,研究分析作者来稿资料中统计分析方法的应用情况。主要包括:统计研究设计、数据收集与表达、统计方法选择中存在的错误和漏洞。

2. 常见错误分类

2.1. 统计研究设计

       统计研究设计包括实验设计、调查设计、临床试验设计和干预实验设计。而在大多数医学期刊文献中并未注明研究设计的类型,导致设计本身不够严谨。

       统计研究设计中应当遵循随机、对照、重复和均衡的原则,322篇来稿中未设置对照组的有38篇,有62篇文献设立了对照组但未提及各组基线资料间是否具有可比性。

       如某文献中探讨关于采用“腹腔镜诊断治疗内异症术后疼痛复发”中, 采用 T 检验说明内异症患者入院前后性交疼痛 ( 前3.39±3.146 ,后 1.06±1.349)、盆腔疼痛(前5.07±3.107,后2.37±2.773)等指标的变化,即得出结论“腹腔镜诊断治疗有利于预防内异症术后疼痛复发”。

       该文章中未设置对照组,仅对单组样本治疗的前后情况进行观察,因而降低了研究结论的可信度。

2.2. 数据收集与表达

2.2.1. 抽样分析

       部分文章中的抽样方法不科学。大多数抽样方法采用的是单纯随机抽样,但未考虑样本的数量是否适合随机抽样;采用系统抽 样时未对预定的抽样规则进行详述;另有部分文章对整群抽样和系统抽样方法存在混淆,整群抽样需在分组之后对群内全部调查,而系统抽样则需从每一部分各抽取一个观察单位组成样本。

2.2.2. 图表分析

       经过对文稿的分析发现,作者在图表中所犯的错误通常为用坐标轴等距离标线表示不相等的数量,且分组中可能存在重复值,改变了图形应有的 变化趋势;此外,数值轴尺度未从“0”点开始,改变了各对比组间的比例关系, 另有部分文章的图形中未标示纵轴(Y 轴)所代表的意义,如图1所示。同时,统计学要求文章中的表格一律为三线表,但仍有部分来稿文章中未使用规范的表格格式上的刻度值。

2.2.3. 数据分析

       在来稿中有作者采用均数和标准差描述数据的分布情况, 但数据标准差过大, 大于均数的一半或大于均数,没有仔细核实数据分布类型,更有甚者在文章中存在数据前后不一致的情况。

2.3. 统计方法的选择

       322篇来稿共涉及统计学方法12种,主要包括t检验、χ2检验、方差分析、两变量间相关性分析、回归分析(二分类的Logistic回归 、有序多分类有序的Logistic回归以及ROC生存曲线等,其中t检验、卡方检验、方差分析、两变量间相关性分析等常用统计方法的使用频次较高,如表1所示。

2.3.1. 定量资料的统计方法

       对于定量资料而言,常见的研究设计类型有:成组设计、配对设计、析因设计、重复测量设计等。

       在判断资料设计类型的基础上,还要检验资料是否满足参数检验的条件,如不满足则采用非参数检验方法。

       众所周知t检验应用的前提条件为所处理的数据必须符合正态分布:在来稿中有9篇 对数据未进行或未提及正态性检验,即采用两组独立样本的t检验分析数 据,因而不能得出正确的研究结果。

       误用成组t 检验处理配对设计资料:某来稿文章为探讨“肝切除患者术后营养指标及免疫球蛋白的 变化”,在术后第3天对68例肝切除的患者给予低热量胃肠内营养(HEN), 作者采用成组t检验比较患者手术前后各指标及免疫球蛋白的变化情况。结果如表2所示。

       根据该研究的实验设计和实验目的,应当使用配对设计的t检验。成组t检验是将受试对象分配成两个处理组,而针对同一受试对象手术前后相关指标结果的比较, 不满足成组t检验对独立样本的要求,应属于配对设计中“同一受试对象处理前后的结果进行比较”。

2.3.2. 定性资料的统计方法

       在处理定性资料的数据时,应根据变量类型、假设检验的适用条件来选用适合的统计方法。通过对来稿文章中采用的定性资料统计方法进行分析,常见的错误主要有:忽视方法和使用的前提条件,盲目使用χ2检验,误用χ2检验进行定性资料的相关分析等。

       混淆统计资料类型盲目使用 χ2 检验:某研究将脑出血急性期患者622例,按预后情况分为对照组和观察组,检测两组患者治疗前血清总胆固醇(TC)、低密度脂蛋白胆固醇(LDL-C)、高密度脂蛋白胆固醇(HDL-C)等指标,评价两组患者生化指标的差异情况,见表3。

       本例中,作者对t检验和χ2检验的应用条件混淆不清,该研究中患者的生化指标采用x±S的形式给出,因而组间差异的比较应采用独立样本t检验的方法进行处理。

       不满足χ2检验前提:某文章就“甲状腺结节问题对居民进行访谈,了解居民知晓途径,每位居民举出一种主要来源”,原文作者对不同职业的居民列出的主要媒体种类进行了χ2检验,说明不同职业居民在知晓途径上存在差 异,见表4。

       同小样本四格表的检验方法相同,对于RXC列联表资料, 采用χ2检验的前提要求是理论频数小于5的格子个数不能超过总格子数的1/5,否则应考虑增加样本量,或采用Fisher确切概率法进行分析。本例中的数据属于定性资料,但由于样本数较少,每个单元格中的例数不足5个,因此一般的χ2检验方法不适用列联表数据分析,应采用Fisher确切概率法进行分析。

3. 讨论与建议

3.1. 加强医学期刊编辑统计学理论的培训

       医学期刊编辑的统计学知识与统计学错误的发生存在密切关系。因此,作为医学期刊编辑,应从思想上重视统计学应用的审查,在审读稿件内容时要善于识别统计学使用中的各类错误,注重对论文的统计学问题进行审查,同时也要不断进行统计学相关知识的学习,可定期聘请统计学专家对医学编辑的统计学知识进行系统培训、组织医学编辑参加统计学知识的继续教育等。

       同时建议在期刊中增加常见统计学方法介绍等栏目,刊登与本刊论文关系密切的统计学方法和常见的统计学错误,以提高作者自身的统计学应用水平和科研能力。

3.2. 严格专家审稿制度把控统计质量关

       医学论文文献中需要经常涉及数据收集、处理和分析等工作,由于统计学专业性较强,因而对医学论文的审稿工作需要医学统计专家负责所有论文的统计学审稿,以确保论文的科学性和真实性。

       建议在论文审稿过程中聘请医学统计学专家进入期刊编委会,通过实验设计、数据收集、统计方法选择、统计结果解释和图表等方面对文章统计学应用情况进行全面的评审,并提出具体的修改意见和建议。

3.3. 强化作者的统计学意识,提升科研人员的统计学水平

       目前,科研人员统计分析水平不高与学生阶段的统计学教育、教学质量有直接的关系。由于医学高校中关于医学统计学的课程、课时设置较少,无法达到规范医学科研的目的。

       因此,建议在学校教育中适当增加统计学的学时,从源头上提高医护人员的科研意识与科研水平;其次,应提高统计学教材的质量,教材内容应服务于科研,紧密联系实际,寻找灌输统计学理论和体现实用价值的突破口。另外,可开办科研论文撰写培训班,邀请专家重点讲授科研课题中统计学的设计和方法的正确应用,进而强化作者的统计学意识,增加优质稿源,提高期刊学术质量。

文章来源:天津科技《医学期刊文献中常见的统计学问题分析》2016年1月,作者:闵 莹

资源下载: