基于文献计量视角的医学信息学高被引论文特征研究

       自20世纪70年代末首次规范医学信息学(medical informatics,MI)学科名称以来,国际医学信息学领域发展迅速。

       我国于20世纪80年代起发展医学信息学,科研学者积极开展相关研究,但研究成果及科研能力仍有较大提升空间。

       因此,分析国内外医学信息学领域高质量论文的文献特征信息有助于提升我国的科研质量。目前已有研究采用文献计量学对该领域的学科发展路径、发展趋势、研究热点、学科教育等进行深度剖析,但存在仅讨论国内医学信息学发展、侧重分析研究热点及发展趋势、发表时间较早、文献质量良莠不齐等不足。

       本研究以2022年3月10日基本科学指标(ESI)数据库更新的医学信息学高被引论文(Highly Cited Papers)为研究对象,对发文年限、期刊、作者、国家/地区、研究机构、基金等文献特征信息进行分析总结,利用Incites平台、VOSviewer_1.6.13和CiteSpace 5.8.R3可视化软件进行深入挖掘,以期追踪核心国家、核心机构、核心作者的科研表现,揭示国际医学信息学研究现状,旨在为我国医学信息学领域研究人员开展科研工作提供客观数据支持。

1. 资料与方法

1.1 数据来源

       在Web of Science核心合集的SCI数据库(Science Citation Index Expanded)中检索医学信息学领域相关文献,检索式为“Web of Science类别=Medical Informatics”, 点 击 “Highly Cited Pa-pers”,共获得ESI高被引论文479篇,其中8篇为热点论文,期刊论374篇,综述105篇,会议7篇。

1.2 方法

       使用Microsoft Excel和Incites平台整理统计文献特征信息;Python脚本对作者数据进行归并整理,仅统计位列第一的作者信息,整理归并机构数据时仅统计分析一级机构,并进行人工确认。同时,使用VOSviewer_1.6.13和 CiteSpace.5.8.R3软件绘制国家/地区合作网络和科研机构合作网络图谱。

2. 结果与分析

2.1 发文年份特征

       医学信息学领域的总发文量和高被引论文数呈总体上升趋势,2020年尤为明显。高被引论文的总被引次数为101619次,篇均被引次数为212.15次,6篇被引次数超过1000次,29篇超过500次。

       根据文献被引的时间累积效应,总被引次数和篇均被引次数呈逐年递减趋势。

       但在2012年和2013年出现波动,分析发现这两年引用频次超过500次的文献分别为7篇和8篇,提示这两年医学信息学领域涌现出大量的优秀科研成果,见表1。

2.2 期刊分布特征

       479篇高被引论文来源于24种期刊,见表 2。其中22种为多学科期刊,发表数量最多的是JOURNAL OF MEDICAL INTERNET RESEARCH。

       从出版国家看,英国期刊最多(10 种),其次是美国(5种)。

       从影响力看,14种期刊在该领域中排名前50%,为 JCR Q1区,6种JCR Q2区,7种2020年影响因子大于5分,LANCET DIGITAL HEALTH最高,为24.519,24种期刊平均影响因子为 5.01。

       近半数高被引论文发表在该领域5分以上的期刊上(46.56%),表明医学信息学研究逐渐受到学术界的重视。

2.3 作者分布及合作

       高被引论文中24篇为独著(5.01%),455篇合著(94.99%)。文献署名1~98人不等,87.89%的文献署名人数在2~10人,署名4人的最多(86篇,17.95%)。利用 VOSviewer软件对文献合作数量大于3篇的高被引论文进行作者合作网络分析,发现仅形成3个合作团体,且团队间合作较少,表明国际上该领域已形成一批专业研究团队,内部合作较为密切,但需进一步提升团队间合作意识。

       分析核心作者发现,该领域共有3人以第一作者发表3篇及以上高被引论文,见表3。20人以第一作者发表2篇,可认为他们是目前国际医学信息学领域的重要人物。

       加拿大多伦多大学的Peter CAustin高被引论文数量最多,其次是英国剑桥大学的Dan Jackson和加拿大西安大略大学的G Y Zou。虽然部分研究人员仅发表1篇高被引论文,但不能忽视其对医学信息学发展做出的贡献,如剑桥大学Ian R White2011年发表的Multiple imputation usingchained equations: Issues and guidance for practice被引频次达4244次;范德比尔特大学Paul A Har-ris2019年发表的The REDCap consortium: Building an international community of software platform part-ners被引频次达2209次。

2.4 全球产出贡献及国际合作研究

       479篇高被引论文共来自64个国家/地区。美国最多,高被引论文数高达223篇,其他高产出国家有英国、加拿大、我国和澳大利亚等,见表4。美国、英国和我国的总被引频次均超过10000次;排名前10的国家中仅我国、荷兰、英国和美国的篇均被引次数指标超过 200 次。由此可见,我国医学信息学发展迅速,高被引论文的数量、质量及影响力均位于全球前列。

       高被引论文数量及合作国家数量呈整体上升趋势,24篇独著文献涉及12个国家/地区,226篇国家/地区内合作文献涉及26个国家/地区,229篇国际合作文献涉及64个国家/地区,见表5。对文献合作数量大于3篇的高被引论文进行国家/地区合作网络分析,见图1,表明各国间科研合作密切,国际合作日益频繁。

       CiteSpace分析发现,德国、比利时、南非、丹麦等国家节点的中介中心性较强,见图2,表明对医学信息学领域高被引论文的合作网络具有较大贡献。

2.5 科研机构产出及合作

       479篇高被引论文共涉及964所科研机构,一作归属科研机构306所。排名前10的研究机构中6所来自美国,4所来自英国,1所来自加拿大,见表6。哈佛大学、伦敦大学和多伦多大学的总被引次数均超过7000次,篇均被引次数超过300次的有伦敦大学、伦敦大学学院和英国医学研究委员会生物统计学所,表明英国知名科研机构虽然发文量不及美国,但文献质量及影响力不亚于美国。

       我国共65所科研机构为医学信息学高影响力科研产出作出贡献:

       其中大陆55所、香港5所、澳门1所、台湾4所;54所为高校/研究院、9所为医院、2所为政府部门。中国科学院发表文献数量最多(5篇),其次是香港中文大学(4 篇),之后是北京理工大学、北京协和医学院、华中科技大学、深圳大学、中山大学、温州大学、香港理工大学和香港大学(3篇),提示高校/研究院是我国医学信息学领域的研究主力军,但整体科研水平及影响力仍有待进一步提高。

       CiteSpace结果显示,香港中文大学、约克大学、北卡罗来纳大学、美国国立卫生研究院、约翰斯·霍普金斯大学、西奈山伊坎医学院的机构节点中介中心性较强,表明其对该领域科研合作网络的贡献十分突出。我国大陆科研机构的合作水平较少,仍需重视培养科研团队合作能力及合作意识,拓展国际合作交流圈。

2.6 基金资助

       基金资助文献往往具有较高的研究水平和意义。高被引论文中共有334篇获得基金支持,总被引次数为73775次,篇均被引次数为220.88次;145篇无基金支持的高被引论文总被引次数为27844次,篇均被引次数为192.03次。

       由图4可知,2011-2021年基金资助的高被引论文数量呈总体上升趋势,但占各年高被引论文总量的比例呈总体下降趋势。综上所述,基金资助对文献质量具有重要作用,但并非决定因素。

       基金资助机构中排名前10的资助机构大部分归属于美国和英国,见表7。美国卫生与公众服务部和美国国立卫生研究院资助的高被引论文数超过100篇,欧盟委员会和英国科研创新办公室资助超过50篇。我国国家自然科学基金共资助19篇高被引论文,排名第9,且资助时间均为2015年之后。

       2015年前后,我国出台了一系列医疗卫生信息化建设的政策方针,如关于促进和规范健康医疗大数据应用发展的指导意见、“健康中国 2030”规划纲要、“十三五”卫生与健康规划等,表明政策支持有助于推我国医学信息学的高质量发展。

3. 讨论

       本研究以ESI数据库为数据来源,基于文献计量学对2011-2021年医学信息学高被引论文的文献特征进行分析,探讨国际医学信息学领域的研究态势。

       研究发现,近10年医学信息学的研究方向逐渐广泛,发文量和高被引论文数量呈增长态势,欧美等发达国家所占比重明显,且大部分受基金资助,中国国家自然科学基金的资助文献仅占3.97%。

       此外,该领域已形成明显的国际科研态势,美国、英国和我国的产出量、被引次数指标均位于前列。高被引论文往往由多位来自不同科研机构的科研人员以共同合作的方式完成,且以国际合作或国家/地区内部合作为主,提示多方合作更利于完成高质量论文。

       现阶段我国医学信息学已处于高速发展阶段。从2011-2012年的零成果到2015-2021 年高被引论文数持续位列前5,2020年达到高峰,7篇文献的被引数量超过200,表明在该领域我国已实现质和量的飞跃,成为国际医学信息学领域的高生产力和高影响力国家之一。

       从核心作者和科研机构指标上看 ,我国高被引论文虽多以团队合作形式完成,但与其他国家/科研机构的合作较少,提示尚未完全形成高质量的研究团队,需重视与知名高校和科研机构的合作交流,拓展学术交流圈。

       从核心作者和科研机构指标上看,此外,基金资助情况是反映一个国家对学科重视程度的指标之一。我国国家自然科学基金资助的高被引论文总数占比不到4%,占我国该领域基金资助ESI高被引论文的50%,表明对医学信息学学科发展的重视程度有待提高。

       综上所述,10年来国际医学信息学领域发展迅速,国家、机构及作者间合作活跃。我国在该领域的科研水平和影响力提升显著,但核心作者、国际/机构间的合作层次不足,有待进一步改善。

       积极关注高产国家的科研机构、核心作者的科研动态,及时掌握热点前沿,加强知识交流意识,拓展研究方向,有助于推动国内医学信息学的发展。

       本文存在一定局限性,由于数据来源仅为Web of Science核心合集SCI数据库,虽然保证了文献质量,但是数据范围过窄。此外,由于医学信息学为典型的跨学科领域,研究方向广泛,部分高影响力文献并未列入该类别,导致未纳入研究范畴,可能影响结果的精确性。

文章来源:《医学数据科学》2022年8月,作者:陈晓炜

资源下载: