500篇文献大批量下载,全网评测,唯一可行方案!

开始之前,先给大家道个歉,上次给大家分享的通过下载器批量抓取scihub资源的方式,虽然使用方法简单,但是经过多位粉丝朋友反馈,再加上我自己增大文献数量去测试,发现确实存在一定问题。

后台接到粉丝朋友们的反馈后,我开始以500篇/次的数量去测试网上所有的批量下载方案,最后发现有且仅有一种方案可以稳定实现,真正的批量下载scihub。

1、DOI+下载器【我打我自己】:

当报错窗口数达到一定数量,下载就会自动停止,无法继续下载,只能手动不停的关闭弹窗,因为我自己的使用习惯一般不会同时下载超过50篇文献,所以在初次写分享文章时,并没有发现这个使用问题。

2、Scihub桌面客户端【全废】:

scihub-Eva、Y学术、Spider、Desktop,恕我直言,一个能用的都没有。下载几篇之后,就会陷入无尽的失败之中。

3、Zotero+scihub批量【慢的惊人,谁用谁知道】:

平均三分钟一篇,正确率可人,但是速度不敢恭维,要下载500篇文献,估计需要后台等待一个下午。

4、Python脚本:

使用方法最复杂,但也是唯一可以实现稳定下载500篇文献的神器。亲测,500篇下载结束,用时30分钟左右。网速快的时候,十五六分钟。

如果你只需要批量几十篇文献,那么小编还是很推荐你们使用前三种方案的,毕竟不用配置,即开即用,非常方便,纯纯的小白快乐屋。

但是!如果你要批量下载一百篇,甚至五百一千篇文献,那么除了使用Python脚本,别无他法,亲身实践,欢迎反驳。

听到脚本先别跑,本文并不是教你如何写python代码的技术性文章(小编也不会Python啊),而是一篇纯纯的工具分享文章,教你如何使用大佬已经写好的代码,稳定的实现python批量下载,全程小白视角,百分之百可复现。

本文所用Python代码并非原创,来源于CSDN上Trxye大佬,此处感恩大佬的无私分享。

强烈建议转发收藏本文,这就是唯一有效的大批量下载解决方案。要不是网上没有真正教小白怎么用这个代码的教程,小编怎么会拖更两个星期嘛,哭哭,自学真的超难的!

一、导出endnote中的DOI 信息

Python的下载依旧是要基于DOI的。所以在开始之前,将所有需要下载的文献DOI全部整理到一个txt文档中,一行一个DOI,最后一行以空行结尾。划重点,最后一个DOI也必须换行!

在WOS、Pubmed拿到批量DOI的流程相信不用我多说,直接选择批量导出,就可以拿到批量的DOI。

这里我重点分享一下,如何把endnote里的所有文献的DOI给导出来。因为很多学员都是基于endnote进行文献筛选的,初筛完成之后要批量下载文献了,不知道如何把这些文献的DOI信息导出来,进行批量下载。

1.1 新建输出样式

=>编辑Edit

=>输出样式Output Style

=>新建输出样式New Style

=>参考文献Bibliography

=>模板Templates

=>插入DOI

=>保存样式

1.2 批量导出文献DOI

=>参考信息输出样式

=>更改为我们新建的样式

=>全选需要下载的文献

=>选择输出

1.3 新建一个txt文档存放

虽然endnote输出的文件就是txt文件格式,但是如果用这个文件去下载会运行失败,原因未知,小编真不会Python,别问为什么了。

解决方案:

手动新建一个txt文件,命名为doi.txt,将导出的DOI信息转移到这个txt文件里来,就可以了。

二、环境配置:下载Python及编辑器

安装其实没什么难度,我这里主要展示几个必须要注意的坑,其余均默认即可。

虽然简单,但是标注出来的都是必须注意哦,否则大概率报错。

2.1 安装Python

官网:https://www.python.org/

2.2 安装Pycharm

这是个编辑器,为了让后续用起来更顺手一点。

官网:https://www.jetbrains.com/pycharm

除展示外,其余全部默认安装。安装完成后,进入第三步。

三、安装代码依赖包

安装完成后,将代码用pycharm软件打开。初次使用,会弹窗信任文件,信任然后打开。

代码文件

点击链接后台回复【代码批量】获取。

点击链接后台回复【代码批量】获取。

点击链接后台回复【代码批量】获取。

⬇⬇⬇

https://mp.weixin.qq.com/s/HVboLi3LhnRvdtyEzx2CTw

进入软件后,会有一个提示窗口,不管他,直接关闭即可。

此代码的运行必须基于两个库requests和bs4,所以最后只需要安装好这两个库,然后后续直接运行大佬的代码即可。

安装也很简单

3.1 在pycharm中找到:

File->settings ->Project:Desktop:

3.2 安装bs4库

3.3 安装requests库

四、修改代码为自己所用

前述所有准备工作完成后,就可以进入使用阶段了。

4.1 设置PDF存放的文件夹

将存放的文件夹路径复制到双引号中间部分

❗直接复制的路径每一层均缺少一个反斜杠,需补上;

❗文件夹最后需补上两根反斜杠;

按示例格式来就可以

4.2 设置DOI文档的位置

右键DOI文档,查看属性,将位置复制到双引号中间替换。只能替换双引号中间部分,不能删掉双引号哦!

❗补上反斜杠

❗直接复制缺少【文件名.txt】这一部分,补上

4.3 还可以更改scihub地址

众所周知,scihub经常访问不了,所以下面这里是可以换scihub地址的。哪个能用,用哪个。

好家伙,终于到运行这一步了!点击运行!

本文代码文件、软件安装包

均提供打包下载地址

点击链接:

https://mp.weixin.qq.com/s/HVboLi3LhnRvdtyEzx2CTw

回复【代码批量】

回复【代码批量】

回复【代码批量】

系统自动发送,免费领取

Toedit,专业论文润色、文稿翻译、投稿指导、SCI服务机构。我们的润色和翻译人员都是相关行业的硕博士,若因语言问题拒稿,或返修意见中有提到语言问题,可无限次免费返修,直到您100%满意。

资源下载: