队列研究医学论文中常见统计学问题
迟殿元1 薛海峰2
1.齐齐哈尔医学院学术理论研究部,齐齐哈尔 161006;2.齐齐哈尔医学院公共卫生学院,齐齐哈尔 161006
[摘要]目的 了解目前我国医学期刊中采用队列研究设计的文章中统计学方法的应用情况,发现问题并提出相应对策,以提高此类文章的数据处理及撰写水平。方法 检索2014~2015年中国知网、万方数据库收录的有关队列研究的论文,对其进行系统的统计学方法分析。结果 论文中普遍存在的统计学问题包括χ2检验和Logistic回归的误用、研究对象描述不清楚、结局事件及其判断标准描述不全面等。结论 论文作者应充分认识流行病与医学统计学方法在科学研究中的重要性,并具备一定的相关理论知识;期刊编辑部应加强论文的流行病与医学统计方法学的审查工作。
[关键词]医学期刊;队列研究;统计学问题;对策
队列研究又称前瞻性研究、随访研究及纵向研究,是将一个范围明确的人群按是否暴露于某可疑因素及暴露程度分为不同的亚组,追踪其各自的结局,比较亚组之间结局的差异,从而判定暴露因子与结局之间有无因果关联以及关联大小的一种观察性研究方法[1]。这里暴露是指研究对象接触过某种待研究的物质(如重金属等)、具备某种待研究的特征(如年龄、性别及遗传因素等)或行为(如吸烟等)[2]。观察的结局主要是与暴露因子可能有关的结局。队列研究中先因后果的时间顺序相对明确,受一些偏倚的影响小,是观察性研究方法中验证病因能力最强的研究方法[3],其证据等级仅次于严格设计的随机对照试验。尽管我国的前瞻性队列研究起步较晚,但自20世纪八九十年代起也陆续开展了一些队列研究[4]。如果这些研究未能正确使用该研究方法,不但不能有效验证病因假设,还有可能得出错误的结论。本文收集并分析了近年国内公开发表的队列研究论文,发现其中存在的统计学问题并提出改进意见和建议,旨在引起作者、编者和审稿专家的重视,提高期刊论文的质量。
1 队列研究文献的检索
以 “队列研究”“前瞻性研究”“随访研究”“纵向研究”为关键词,在中国知网(CNKI)和万方数据库中检索2014~2015年公开发表的队列研究文献共1874篇,剔除重复文献和非研究性文献后,获得研究性文献929篇(表1)。
表1 2014~2015年公开发表的队列研究中文献情况[n(%)]
2 载文量及统计学方法应用情况
根据李康等[5]主编的《医学统计学》和Cochrane推荐的Newcastle-Ottawa-Scale(NOS)工具[6]对检索到的文献进行统计学方法应用情况评判,评判结果在文献评价表中登记并复核,采用Excel管理和分析数据。结果发现,绝大多数队列研究采用χ2检验和Logistic回归方法进行统计推断,约占82.0%;而使用了生存分析及Cox比例风险回归模型的仅占13.0%(表2)。
表2 2014-2015年公开发表的队列研究中统计学方法具体应用情况[n(%)]
3 常见统计学问题
3.1 研究对象描述不清楚或不确切
研究对象的选择是随访研究的首要问题,因此文中关于研究对象的描述必须准确清楚,根据研究属于总体研究或是抽样研究,对研究对象的描述应加以区别[7]。目前我国队列研究中关于研究对象的描述主要存在的问题为:描述中对总体研究或抽样研究未加以明确说明;抽样研究中的描写模棱两可,未说明具体抽样方法。从统计学上讲,总体研究的研究对象是根据研究目的所确定的同质观察单位的全体,而抽样研究的研究对象是总体中随机抽取的部分观察单位。
例如,就“某高校教师肥胖率及其对糖尿病发病影响的研究”而言,首先要制定相应的纳入标准与排除标准,研究的纳入标准为“某高校在编、在职且未患糖尿病的教师”,排除标准为 “妊娠期、哺乳期女教工”。如果研究为总体研究,其研究对象应是该高校的所有在编、在职且未患糖尿病的非孕(哺乳)教师;如果研究为抽样研究,则其研究对象是该高校所有在编、在职且未患糖尿病的非孕(哺乳)教师的一个随机样本,研究对象描述中还应具体说明所使用的抽样方法,如单纯随机抽样、系统抽样、整群抽样或分层抽样等,同时写明随机抽样的具体实施方法。
3.2 结局事件及其判断标准描述不全面
随访研究的另一个重要因素是结局事件,其指随访观察中将出现的预期结果事件,研究中既要记录是否发生了结局事件,还应记录是否存在失访及失访原因(失去联系、因其他疾病死亡、研究终止)。分析我国2014~2015年已发表的队列研究文章发现,大多数研究均未描述是否存在失访,部分研究对结局事件的判断标准描述不全面。按照队列研究的设计要求,结局事件要有明确统一的判断标准。例如,2型糖尿病结局的判断标准[8-9]:确诊糖尿病,即自我报告医生诊断糖尿病和(或)正在使用胰岛素和(或)口服降糖药治疗者;未确诊糖尿病,即未诊断糖尿病但空腹血浆葡萄糖水平≥7.0 mmol/L者;对于随访期发生死亡者,如果其死亡原因中含有糖尿病也认为是随访期发生2型糖尿病。
3.3 统计分析不充分或错误
3.3.1 基线特征描述不全面 队列研究中暴露组与非暴露组基线特征是否存在差异以及差异的方向直接影响研究结果的解释,因此基线特征的描述是队列研究资料分析必不可少的内容。而目前国内的队列研究文献中存在较严重的不按暴露有无分组描述基线特征的现象。此外,如随访过程中存在失访,则失访者与随访者基线特征的比较也直接影响研究结果的解释。在查阅的929篇研究性队列研究文献中无失访情况描述,无失访者与随访者基线特征比较者达90%以上。
因此,队列研究的资料分析应首先比较暴露组与非暴露组基线特征的一致性,以分析基线特征的差异对研究结果是否有影响以及影响方向,同时也可确定多因素分析中需要调整的混杂因素。如果研究中有失访,还应比较失访者与随访者的基线特征是否一致,以判断失访对研究结果是否有影响以及影响方向。
3.3.2 统计推断方法选择不当 统计学方法的选择一向是医学科学研究中的难点问题。队列研究中主要涉及的统计推断方法包括 χ2检验、Logistic回归以及Cox比例风险回归模型,此三种方法的误用和混用在队列研究文献中较严重,包括误用χ2检验代替Logistic回归、误用Logistic回归代替Cox回归等。由表2可知,929篇研究性队列研究文献中应用了Cox回归的仅占13.0%,且2015年的比例与2014年基本相同(13.1%vs 13.0%),可见这一方法的正确应用近两年内并未引起作者以及编辑足够的重视。
队列研究中统计学方法选择的正确思路为[10]:若暴露组与非暴露组的基线特征一致,则可以直接应用χ2检验比较暴露组与非暴露组结局事件发生率的差异,以判断暴露因素与结局事件是否有关联,同时计算相对危险度(relative risk,RR)及其95%置信区间,进一步说明两者的关联强度。相反,若暴露组与非暴露组的基线特征存在差异,应采用多因素的回归分析对混杂因素进行控制。如果数据资料中无时间变量,可采用Logistic回归,并在模型中调整组间存在差异的基线特征变量;如果有时间变量,则应采用Cox回归,并在模型中调整组间存在差异的基线特征。
3.4 其他问题
国内公开发表的队列研究文献存在的其他问题:①应用Logistic回归或Cox回归时,分类变量或等级变量无赋值说明,造成结果解释的混乱。例如,只有在明确“男性=1,女性=0”或者相反的情况下,才能正确解释暴露因素与研究结局之间的关系。②误用χ2检验公式:应该使用校正公式时,却应用了非校正的通用公式或专用公式;不能应用χ2检验时,却计算了χ2值。例如,两组率比较时,只有满足总例数n≥40且理论频数T≥5的条件下,才能采用非校正的四格表χ2检验的通用公式或专用公式;如果n≥40且1≤T<5,应采用四格表χ2检验的校正公式;如果n<40或T<1,应采用四格表资料的Fisher确切概率法,χ2检验不再适用[2]。三组或三组以上率(或构成比)比较,如果T<1或1≤T<5的格子数超过总格子数的1/5时,就不能采用χ2检验,而应采用适当的行列合并、加大样本量或应用Fisher确切概率法等处理方式。③资料的基本统计描述不规范。如,计量资料应以“均数±标准差()”表示,计数资料应以“例数(百分比%)”表示,而且构成比的合计应该是100%或1。此外,研究结果中未写出具体的统计量值和P值、样本量过小造成检验效能偏低而得到假阴性结论的问题比较多见。
4 队列研究医学论文作者及编辑应注意的问题
分析结果表明,队列研究医学论文的统计学方法应用基本正确,编辑人员也比较重视统计学方法的使用情况,但是仍有部分论文在研究设计和统计分析方法的应用上存在一些问题,导致发表论文的研究结果缺乏科学性和可信性。为使作者、编辑和审稿者高度重视统计学的正确应用,进一步提高队列研究医学论文的质量,笔者认为还应做好以下工作。
4.1 提高对统计学知识的认识,强化统计学意识
目前,国内医学科研工作者未认识到医学统计学的重要性,对医学统计学的重视程度还不够。因此,要加大“医学统计学在医学科研中重要性”的宣传力度,提高科研工作者对医学统计学的认识;在医学科研工作中普及医学统计学知识,强化医学统计学意识,促使其在科研设计、数据分析和论文撰写中正确应用医学统计学方法[11]
4.2 加强流行病学与医学统计学专家审稿工作
医学研究,包括队列研究,其统计分析都是以科学研究设计为基础的。研究设计不科学、有缺陷,即使应用了高级的统计学方法也于事无补。所以,审稿专家在具备丰富的专业知识的同时,还应具备一定的医学统计学和流行病学知识,能够做到从研究设计到统计分析,系统地审核研究结果的科学性、可靠性,确保论文质量[12]。此外,如果条件允许,所有稿件应先通过流行病学与医学统计学专家的审核,然后再由各专业学科专家审稿,以确保研究成果的真实可靠[13]。因此,医学期刊编委会应增设流行病学与医学统计学专业的专家委员,严格审核论文的研究设计和统计分析,不合格的论文坚决不发表,这样才能不断提高稿件质量和水平。
4.3 定期培训期刊编辑人员
有计划地定期聘请流行病学与医学统计学专家对期刊编辑人员进行流行病学与医学统计学知识培训[14]。通过定期举办专业知识讲座、选派编辑人员参加专题培训班、定期组织考核、根据考核结果给予适当奖励等措施,以提高编辑人员学习流行病学与医学统计学知识的积极性,不断提高其相关知识水平,最终达到提高论文质量的目的。
[参考文献]
[1]张啸飞.前瞻性队列研究及生存分析[A]//2014浙江省临床流行病学与循证医学学术年会论文汇编[C].浙江,2014:15.
[2]李立明.流行病学[M].5版.北京:人民卫生出版社,2003:58-59.
[3]李立明,吕筠.大型前瞻性人群队列研究进展[J].中华流行病学杂志,2015,36(11):1187-1189.
[4]王慧,陈培战,张作文,等.我国人群队列研究的现状、机遇与挑战[J].中华预防医学杂志,2014,48(11):1016-1021.
[5]李康,贺佳.医学统计学[M].6版.北京:人民卫生出版社,2013:84-150.
[6]何琼,黄渊秀,康文婧,等.2001-2010年我国伤害预防病例对照研究及队列研究文献质量评价[J].中华疾病控制杂志,2014,18(10):913-916.
[7]王芳,戴国华,娄昊.循证中医药队列研究的随访设计[J].山东中医杂志,2016,(1):14-17.
[8]樊森,陈纪春,黄建凤,等.中国成人看电视时间与2型糖尿病发病关系的前瞻性队列研究[J].中国循环杂志,2014,29(5):372-376.
[9]李卫东,傅坤发,连燕舒,等.成人非酒精性脂肪肝与2型糖尿病发病关系的前瞻性队列研究[J].中国全科医学,2015,18(28):3426-3429.
[10]韩梅,陈薇,曹卉娟,等.比较效果研究常用方法之二:队列研究设计[J].现代中医临床,2015,22(3):20-23.
[11]沈洪兵.重视大型队列研究的人才梯队建设和技术储备[J].中华预防医学杂志,2014,48(7):547-548.
[12]高永,张中文,石德文,等.基于Excel的统计分析系统在期刊编辑部审稿中的应用[J].编辑学报,2013,25(5):478.
[13]黄晨,袁平戈,张大志.医学期刊来稿中有关统计学错误分析[J].现代医药卫生,2013,29(15):2268.
[14]韩磊.医学期刊编辑提升统计学素养的难点及策略[J].科技与出版,2016,(1):50-53.
Analysis of common statistical problem s in medical papers on cohort study
CHIDian-yuan1XUE Hai-feng2
1.Department of Academic Theory Research,Qiqihar Medical University,Qiqihar 161006,China;2.School of Public Health,Qiqihar Medical School,Qiqihar 161006,China
[Abstract]Objective To understand the application of statistical methods in papers adopting cohort study design in medical journals,uncover some important issues,and put forward the corresponding countermeasures,furthermore,to improve the data processing and writing level of such papers.Methods Papers published on cohort study from 2014 to 2015were retrieved in China National Knowledge Infrastructure andWanfang Database,and were analyzed systematically by statisticalmethods.Results Common statistical problems found in these papers included the followings:misuses of chi-square test and Logistic regression,no clear description of study subjects,and no comprehensive description of outcomesand its judgmentstandard.Conclusion The papers′authors should fully realize the significance of epidemiology and health statistics,and master the relevant theoretical knowledge;the editorial departments should strengthen epidemiological and statistical examination onmedical papers.
[Key words]Medical journal;Cohort study;Statistical problem;Countermeasure

[中图分类号]
R181.2+3
[文献标识码]A
[文章编号]1674-4721(2016)08(b)-0152-03
(收稿日期:2016-05-14本文编辑:王红双)