论文一键查重:全文抄袭两分钟降至一半

最近,毕业生的论文乱七八糟,他们购买了减肥服务。论文抄袭正确,参赛作品火上浇油。恰逢毕业季节,论文的复检问题再次引起人们的关注。

南都记者注意到,很多网站都推出了以人工智能技术为宣传卖点的“一键减肥”服务。由于其速度快、价格低、精度高,已经形成了产业链。淘宝店的销售额高达每月8592件。经过测量,使用网站的免费试用功能,《知网》中包含的原始文本的重复率在两分钟内降低到57%。

一些大学教师称“一键减肥”为“畸形技术”,认为这肯定会助长学术不端行为。一些老师说,当导师看到论文的整体结构时,很容易区分哪些是学生的个人作品,哪些是对他人作品的总结。“重点是纸张的质量。”

“一键降重”两分钟,重复率从100%降至57%

早在2018年,就有人总结了几款论文降重修改重复率的网站,不过其中大多数网站只提供逐句比对,仍需要人工手动修改。当时,可以机器一键降重的网站并不多,而且准确性不高。比如,一个名为“PaperYY”的网站称“大数据AI算法,通过千万降重语句训练,达到针对毕业论文优化效果。速度快,最快只需几分钟即可出降重结果。价格廉价,比检测费用还低。对于高重复率的文章,效果明显。”不过,该网站也表示,机器降重的准确性欠缺,需要后期人工校对。所以“无售后服务,降重比例浮动不定。”

近年来,随着人工智能技术的产业化应用,提供“一键降重”服务的网站数量明显增多。它们多以“人工智能”“AI”“大数据”等技术作为背书,以“速度快、价格低廉”为卖点。甚至有网站称“100%抄袭的一键降重即可100%原创”。

南都记者将一篇已于2015年被收录进知网的文章原文输入1000字,作为“100%抄袭”的样本,对多个“一键降重”网站进行了实测。

在使用某网站V1初级降重功能对这篇原文降重处理后,两分钟内文章重复率即降至57%;二次降重后,文章重复率降至53%。该网站为会员制,非会员可以试用“V1初级降重功能”一次,购买29元/天的会员后,可使用V2、V3功能,“高级算法,降重效果更好。”该网站称,系统依靠AI、自然语言处理、深度学习技术深度修改文章,降重后重写质量几乎可以接近人类的水平。截至记者发稿前,该网站降重系统介绍文档观看次数已超5万。

另一降重网站则宣称自己“采用第五代人工智能神经网络降重模型,数据训练达到亿级水平,进一步优化修改后的语句通顺度、连贯性、上下文结构,较上一代提升30%”。目前,网站收费标准为5.00元/千字。在对上文所用同一篇文章进行降重处理后,重复率从100%降至52%。但同时论文修改幅度也更大,甚至对论文中多次出现的人名进行了修改,比如将文中的“维纳”修改成“比娜”。

仔细对比降重前后的文章可以发现,所谓的“一键降重”算法其实是对文章语句进行了删除简化、同义替换修改文字描述等处理。而且降重后的文章语句通畅,基本能够保持文章原意。但同时,降重算法也存在修改文中引用章节名、将专业术语改为近义词等问题。

准确性有较大提高、再加上价格优势,机器降重已经形成一个产业链条。在百度上搜索“机器降重”,可以得到两百九十多万个搜索结果。淘宝网已将搜索词“论文降重”“降重”进行了屏蔽,但仍可以通过“降重修改”为关键字进行搜索得到约400多个结果,降重价格从0.69元到300元不等,其中最高销量达每月8592件。有买家在评论中表示“重复率从44%降到了18%”,“比来回中文-英文-中文翻译生成的句子更通顺,不需要大改动”;也有买家发现机器降重“只是改了一下语序”。

高校教师:或助长学术造假歪风,“其实很容易看出来”

查重已经成为高校毕业生提交毕业论文前的“必选动作”。据了解,一般学校会提供给学生1~2次学校系统免费查重机会,但是不少学生为求心安,会在形成初稿后就提前在网上寻找其他系统查重,以及自行降重。甚至有学生为论文查重花费数千元。

“一键降重”是否会成为学生的热门选择?中国传媒大学汉语言文学专业的应届毕业生车车表示,虽然如今的机器降重算法已经达到一个比较精细的水平,但她还是对此持否定态度,“这种行为不值得提倡。文学专业的人比较抠字眼、语法,机器降重虽然方便,但我还是宁愿自己去改。”

中国科学技术大学电子信息工程专业的应届毕业生马君瑜则认为“一键降重功能”可以起到辅助作用,为学生论文降重提供思路,“这种技术总是有利有弊的,主要看你怎么使用。”

对于“一键降重”技术,江西财经大学统计学院教授胡平波指出,论文查重是为了杜绝学术不端,大数据降重或将助长学术造假歪风。

中国传媒大学的一名老师认为“一键降重”是一种“畸形的技术”,肯定会助长学术不端行为,但是助长程度不同学科可能有所不同。他说,“对于计算机专业等相关工程类专业,学生只要独立完成导师指定课题任务,达到要求是很容易的事情。只有那些没有真正去做事情的同学,写不出论文才会求助于(一键降重)这种畸形技术。”

中国传媒大学计算机应用技术专业应届硕士毕业生茜茜认为,其实对“一键降重”技术不必有太多顾虑,论文审核目的也不是以重复率为标准,“主要还是以内容为核心,如果重复率过关,内容一塌糊涂根本没有太大用处。”

中传计算机与网络空间安全学院隋爱娜教授也表示论文重复率不是最主要的,即使不查重,导师看到论文整体结构其实很容易就能分辨出来哪些是学生个人工作,哪些是总结他人工作。“重点在于论文质量如何。”隋爱娜说。

资源下载: