开始之前,先给大家道个歉,上次给大家分享的通过下载器批量抓取scihub资源的方式,虽然使用方法简单,但是经过多位粉丝朋友反馈,再加上我自己增大文献数量去测试,发现确实存在一定问题。
后台接到粉丝朋友们的反馈后,我开始以500篇/次的数量去测试网上所有的批量下载方案,最后发现有且仅有一种方案可以稳定实现,真正的批量下载scihub。
1、DOI+下载器【我打我自己】:
当报错窗口数达到一定数量,下载就会自动停止,无法继续下载,只能手动不停的关闭弹窗,因为我自己的使用习惯一般不会同时下载超过50篇文献,所以在初次写分享文章时,并没有发现这个使用问题。
2、Scihub桌面客户端【全废】:
scihub-Eva、Y学术、Spider、Desktop,恕我直言,一个能用的都没有。下载几篇之后,就会陷入无尽的失败之中。
3、Zotero+scihub批量【慢的惊人,谁用谁知道】:
平均三分钟一篇,正确率可人,但是速度不敢恭维,要下载500篇文献,估计需要后台等待一个下午。
4、Python脚本:
使用方法最复杂,但也是唯一可以实现稳定下载500篇文献的神器。亲测,500篇下载结束,用时30分钟左右。网速快的时候,十五六分钟。
如果你只需要批量几十篇文献,那么小编还是很推荐你们使用前三种方案的,毕竟不用配置,即开即用,非常方便,纯纯的小白快乐屋。
但是!如果你要批量下载一百篇,甚至五百一千篇文献,那么除了使用Python脚本,别无他法,亲身实践,欢迎反驳。
听到脚本先别跑,本文并不是教你如何写python代码的技术性文章(小编也不会Python啊),而是一篇纯纯的工具分享文章,教你如何使用大佬已经写好的代码,稳定的实现python批量下载,全程小白视角,百分之百可复现。
本文所用Python代码并非原创,来源于CSDN上Trxye大佬,此处感恩大佬的无私分享。
强烈建议转发收藏本文,这就是唯一有效的大批量下载解决方案。要不是网上没有真正教小白怎么用这个代码的教程,小编怎么会拖更两个星期嘛,哭哭,自学真的超难的!
一、导出endnote中的DOI 信息
Python的下载依旧是要基于DOI的。所以在开始之前,将所有需要下载的文献DOI全部整理到一个txt文档中,一行一个DOI,最后一行以空行结尾。划重点,最后一个DOI也必须换行!
在WOS、Pubmed拿到批量DOI的流程相信不用我多说,直接选择批量导出,就可以拿到批量的DOI。
这里我重点分享一下,如何把endnote里的所有文献的DOI给导出来。因为很多学员都是基于endnote进行文献筛选的,初筛完成之后要批量下载文献了,不知道如何把这些文献的DOI信息导出来,进行批量下载。
1.1 新建输出样式
=>编辑Edit
=>输出样式Output Style
=>新建输出样式New Style
=>参考文献Bibliography
=>模板Templates
=>插入DOI
=>保存样式
1.2 批量导出文献DOI
=>参考信息输出样式
=>更改为我们新建的样式
=>全选需要下载的文献
=>选择输出
1.3 新建一个txt文档存放
虽然endnote输出的文件就是txt文件格式,但是如果用这个文件去下载会运行失败,原因未知,小编真不会Python,别问为什么了。
解决方案:
手动新建一个txt文件,命名为doi.txt,将导出的DOI信息转移到这个txt文件里来,就可以了。
二、环境配置:下载Python及编辑器
安装其实没什么难度,我这里主要展示几个必须要注意的坑,其余均默认即可。
虽然简单,但是标注出来的都是必须注意哦,否则大概率报错。
2.1 安装Python
官网:https://www.python.org/
2.2 安装Pycharm
这是个编辑器,为了让后续用起来更顺手一点。
官网:https://www.jetbrains.com/pycharm
除展示外,其余全部默认安装。安装完成后,进入第三步。
三、安装代码依赖包
安装完成后,将代码用pycharm软件打开。初次使用,会弹窗信任文件,信任然后打开。
代码文件
点击链接后台回复【代码批量】获取。
点击链接后台回复【代码批量】获取。
点击链接后台回复【代码批量】获取。
⬇⬇⬇
https://mp.weixin.qq.com/s/HVboLi3LhnRvdtyEzx2CTw
进入软件后,会有一个提示窗口,不管他,直接关闭即可。
此代码的运行必须基于两个库requests和bs4,所以最后只需要安装好这两个库,然后后续直接运行大佬的代码即可。
安装也很简单
3.1 在pycharm中找到:
File->settings ->Project:Desktop:
3.2 安装bs4库
3.3 安装requests库
四、修改代码为自己所用
前述所有准备工作完成后,就可以进入使用阶段了。
4.1 设置PDF存放的文件夹
将存放的文件夹路径复制到双引号中间部分
❗直接复制的路径每一层均缺少一个反斜杠,需补上;
❗文件夹最后需补上两根反斜杠;
按示例格式来就可以
4.2 设置DOI文档的位置
右键DOI文档,查看属性,将位置复制到双引号中间替换。只能替换双引号中间部分,不能删掉双引号哦!
❗补上反斜杠
❗直接复制缺少【文件名.txt】这一部分,补上
4.3 还可以更改scihub地址
众所周知,scihub经常访问不了,所以下面这里是可以换scihub地址的。哪个能用,用哪个。
好家伙,终于到运行这一步了!点击运行!
本文代码文件、软件安装包
均提供打包下载地址
点击链接:
https://mp.weixin.qq.com/s/HVboLi3LhnRvdtyEzx2CTw
回复【代码批量】
回复【代码批量】
回复【代码批量】
系统自动发送,免费领取
Toedit,专业论文润色、文稿翻译、投稿指导、SCI服务机构。我们的润色和翻译人员都是相关行业的硕博士,若因语言问题拒稿,或返修意见中有提到语言问题,可无限次免费返修,直到您100%满意。