微软学术停用,OpenAlex接手!2亿篇论文免费看!

THE START:为了接替已下线的「微软学术搜索」,大型免费学术索引OpenAlex已于今年年初正式上线,它涵盖2亿篇科学文献,易学易用,完全免费,网站将于2月上线。

最近,大型免费学术资源索引OpenAlex宣布上线,该索引包含超过 2 亿份科学文献。网址:https://openalex.org/

这个资源索引服务名为OpenAlex,源自古代埃及亚历山大图书馆馆名。

创始人表示,该索引对出版物来源、作者信息和研究主题进行编目,旨在绘制这些数据点之间的联系,以创建一个全面的、相互关联的全球研究系统数据库。

去年 5 月4日,微软在博客中表示将于2021年12月31日关闭学术搜索知识图谱(MAG),即Microsoft Academic 网站和底层 API  ,让一些学者和其他使用其数据进行研究和开发的人感到担忧。

为应对 MAG 的下线,位于加拿大温哥华的非营利性学术服务公司 OurResearch利用伦敦慈善机构 Arcadia Fund 提供的 450 万美元的一部分,创建了这项「伟大工程」。

今年1月3日推出的这个免费学术索引数据库,功能上与微软的Academic Graph (MAG) 类似,MAG 是Scopus、Dimensions 和 Web of Science 等学术订阅平台的免费替代品,已于 2021 年底停止运营。

据悉,该索引当前通过可执行复杂搜索的应用程序编程接口或 API 访问。

微软「学术图谱」接班人

无论是研究人员,还是开发者,都需要大量查阅论文、专著等学术成果。近年来,越来越多的人开始绕过学术出版商的「付费墙」,通过多种手段免费获取学术资源。

作为微软MAG的替代品,此前OpenAlex一直在从MAG获得论文、作者和其他数据实体。在MAG正式停止运营后,OpenAlex开始自己从互联网收集更多新内容。

目前OpenAlex已经发布新的 REST API 。与之前下载安装的方式相比,可以更快、更简单地访问 OpenAlex 数据库,无需账户和令牌,完全免费。

目前,通过API可以获取单一实体、实体列表和实体组。

OpenAlex数据集描述了5类学术实体以及这些实际之间的联系。每类实体分别对应其目标:

  • 成果:包括论文、书籍、数据集等,会引用其他成果

  • 作者:做出成果的人

  • 出处:刊载成果的期刊或资源库

  • 机构:(通过作者)与成果相关的大学或其他组织

  • 概念:以话题方式对成果进行标签

OpenAlex表示,探索 OpenAlex 数据集的最简单方法是通过 Web 界面,无需编写代码即可探索 OpenAlex。不过目前网站开发尚未完成,预计在今年2月上线。

尽管MAG已停用,但作为其继任者和替代,OpenAlex将继续维护MAG格式至今年7月2日,从2022年7月起,OpenAlex将不再支持MAG格式。

由于目前尚处于早期开发阶段,各项功能尚待进一步完善,OpenAlex将每日单个用户调用数量限制在10万次以下。

OpenAlex三大优势

在综合比较各种数据库之后,OpenAlex具有明显的三大优势,这将带给用户美好的体验。

提高覆盖率

OurResearch的联合创始人贾森•普里姆(Jason Priem)表示,「OpenAlex的创立是为了实现与其他几个数据库互联互通,使其覆盖更加广泛全面。」

与某个单一数据库相比,OpenAlex拥有更加开放的获取覆盖面,它拥有来自Wikidata 标识符、MAG 、ORCID、Crossref、ROR、Unpaywall等数据资源。

普里姆表示,「我们不仅可以给用户提供文章的免费版本,还可以告诉你该文章的授权和不同版本。」

简单易用,20分钟就会

「OpenAlex是在用一种聪明的方式,将大量的数据库整合在一起。」欧弗顿公司(Overton)的创始人尤安•阿迪(Euan Adie)说。

欧弗顿是家总部位于伦敦的公司,主要用于跟踪政策文件的引用。过去,欧弗顿公司从不同的来源获取数据,包括MAG、ORCID、Crossref,也直接向个人获取。

现在,欧弗顿只使用OpenAlex,寄希望于检索过程更加便捷,简单设置让人容易学会。

「我只需要20分钟就会使用OpenAlex,而对比MAG却要3-4天。」阿迪说。

「我花了大约2小时就学会了OpenAlex,而开始用MAG却要一周。」另一位使用者Roar Bakken Stovner说。

Stovner认为,对于更精通计算机的人来说,MAG可能不算难,而对于那些想要自己尝试开发小项目的人来说,OpenAlex将更容易开始。

不用登录,完全免费

OpenAlex的底层代码在CC0版权许可下可以免费获得,任何人都可以在其上进行开发。

因此,贾森·普里姆(Jason Priem)表示,OpenAlex每两周更新一次,比MAG更向前迈进了一步。

假如,哪一天OpenAlex停止运行,那么,任何人都可以从接着Priem停下的进度继续开发,而不必从头开始搭建数据库。

此前,MAG的用户必须登录系统,并支付少量费用,才可以下载。而OpenAlex可以免费使用。

普里姆表示,这要感谢Amazon Web Services的赞助,不需要注册或登录,这使得使用过程更加友好。

不过,OpenAlex可能会考虑为那些想要超快访问的用户,推出付费高级版本。

但,免费的版本总是可用的。

参考资料

https://www.nature.com/articles/d41586-022-00138-yhttps://www.nature.com/articles/d41586-022-00103-9https://docs.openalex.org/

资源下载: