学术诚信是一个历久弥新的话题。有一群研究者的学术方向就是致力于揭示不诚实个体的特征,发现不诚实行为的影响因素,以期减少不诚实行为及其带来的损失。殊不知不诚实的也可能是研究者自己。近期,有一位研究不诚实行为的“大牛”学者陷入学术造假的漩涡。为什么学术不端行为长期存在?无数案例表明,在造假未被揭露时的收益和曝光后付出代价的不平衡是重要原因之一,改变科研奖惩激励或可减少学术不端的发生。
撰文 | 江倩瑜、巫婷辉(深圳大学心理学院)
审核 | 胡传鹏(南京师范大学心理学院教授)
明知故犯?
不诚实行为(dishonest behavior)一直是社会科学、经济学等领域中非常重要且热门的研究课题。科学家们研究不诚实行为的发生条件、不诚实个体的人格特质等因素,以期减少不诚实行为的发生。
哈佛商学院的Francesca Gino教授,是多年扎根并引领该领域的专家之一。Gino及合作者近十几年来致力于“不诚实领域”的学术研究,发表了数篇影响力很高的文章。谷歌学术网站显示,截至2023年9月26日,Gino的文章被引量达到了33577次,H指数为87。
然而,这位不诚实领域的专家却“身体力行”地走在了不诚实的最前沿。
Francesca Gino
近日,Gino被指控4篇(可能更多)论文涉嫌数据造假。这其中引起最大关注的是一篇她与合作者2012年发表在《美国国家科学院院刊》(PNAS)上的文章,被指存在明显的数据篡改痕迹。这篇文章通过四个实验发现,比起在文件末尾签字,要求在文件开头签字,能让签字者更诚实。这篇论文一经发表便引起了广泛关注,至今被引量高达526次。许多政府机构纷纷使用这一方法,以期避免人们在税务上的不诚实行为[1]。然而,论文原作者Kristal、Whillans和 Bazerman随后试图重复、拓展原来的结果,却发现在开头和末尾签字的被试不诚实行为没有显著差异。除此以外,在英国、危地马拉等当地开展的类似研究均表明被试在税务表开头签字,不能减少说谎、增加税收[2, 3]。于是,包括Gino在内的5位原作者开展了5项概念重复研究和一项具有更高统计效力、经预注册的直接重复研究,系统地证明了在文件开头和在末尾签字的被试不诚实行为无显著差异,推翻了先前的结论[4]。该文章于2020年发表在PNAS上。由于近年来国内外学术界推崇开放科学(Open Science),PNAS等知名期刊强制要求作者在投稿时公开能支撑论文结果的数据材料,因此Gino及合作者于2020年投稿时公开了重复研究以及他们2012年原始文章的数据。
2023年6月,拉曼大学ESADE商学院教授Uri Simonsohn、宾夕法尼亚大学沃顿商学院教授Joe Simmons及加州大学伯克利分校哈斯商学院教授Leif Nelson共同创办的博客DataColada发布了一篇博文[5],披露了Gino等人2012年发表文章(Shu et al., 2012)中的第一个实验涉嫌数据造假,而Gino正是负责研究一数据收集和数据分析的唯一作者。
Uri Simonsohn等人检查该研究的公开数据发现,被试的编号序列和随机分组存在8个异常数据(见下图左侧高亮部分)。通过统计证明,正是这8个异常数据使得结果更符合作者的预期假设(见下图右侧红色标记)。此外,在公开的一个Excel文件中包含的数据代码记录也指向这些数据被人为篡改过。
Gino论文研究一的数据异常,异常值显示出巨大的效应:编号为49的被试在数据集中出现了两次,其人口学信息完全相同。此外,在相邻的几行中,有6名被试的编号没有按顺序出现。
实际上,这篇文章已经不是第一次被人发现数据有问题。大约在两年前(2021年),同样是DataColada的一篇博文指出[6],这篇文章的研究三存在数据造假。负责研究三的作者也是不诚实领域的专家——著名行为科学家、杜克大学Dan Ariely教授。该研究是一项现场实验,由Ariely与一家汽车保险公司合作开展。研究者将13488名顾客随机分到实验组(在保险审计表顶部签字)和控制组(在保险审计表底部签字),并要求他们报告保单所涵盖的汽车当前的里程表读数。由于汽车驾驶里程越少,事故风险越低,保险费也会越低,因此顾客报告的汽车当前里程数与保险公司记录在案的基线里程数的差值代表了被试的不诚实水平。结果发现在顶部签字的顾客报告了更高的汽车里程数,即更低的不诚实水平。然而,Data Colada的文章认为该实验数据至少进行了两种伪造:(1) 基线的部分数据是通过复制另一部分数据再稍作修改(加上随机数)生成而来的;(2) 所有当前的里程数是计算机生成的50,000以内的随机数(参见《研究如何减少不诚实行为的PNAS论文涉及数据伪造》)。
在2021年Ariely数据造假事件被曝光后,Gino曾作出回应称,自己是基于信任与Ariely合作,并假设他提供的数据都是没有问题的。她还称:“尽管很难过,但这次经历加强了我对开放科学运动的坚定承诺”,“我在担任Organizational Behavior and Human Decision Processes(《组织行为和人类决策过程》)期刊的主编期间,组织了一个关于开放科学的特刊……,这是我担任编辑期间最自豪的时刻之一。”该文章于2021年9月13日已被期刊撤稿。
据悉,Ariely仍活跃在学术界。而Gino的情况则严重得多。哈佛商学院院长Skrikant Datar决定让Gino停薪休假,并开始了特殊的程序,试图剥夺她的终身教职,还取消了她的医疗福利,禁止她进入校园,禁止她在哈佛的出版平台上发布,并通知了发表她研究的期刊学校的行动。如果这次审查成功,Gino将成为哈佛大学第一位被强行撤销终身教职的教授。
经哈佛商学院研究诚信办公室调查核实后,目前Gino有两篇论文已被Psychological Science(《心理科学》)杂志撤回,还有至少一篇论文正在被撤回。被撤回的一篇文章是Gino于2014年发表的,研究结果发现那些在猜骰子任务中虚报正确猜测数量的人会更有创造力。期刊撤稿声明中指出,“文章中报告的说谎人数与其早期数据集中记录的数量对不上,且创造力任务中存在个别手动更改的数据,而当研究人员纠正了这些问题后,主要的研究结果就不再成立了。”另一篇文章发表于2015年,指出那些被要求通过撰写与自己观点相斥的文章来作出不真实行为的人,事后会感到“道德上的不纯洁”,并对一系列清洁产品的受欢迎度评价更高。作者认为这表明他们感到有必要洁净自己。根据撤稿声明,这篇文章的数据集是Gino两个数据文件的合并,但这里面没有包含所有被试的数据,同时又包含了一些额外的没有提及的数据,而作者并没有明确的纳入和排除标准。调查人员根据作者最原始的协议来合并数据后同样无法重复出文章原来的结果。
Gino数据伪造事件的影响仍在持续发酵中。日前,Uri及其团队给Gino的近150位合作者发送了电子邮件,询问他们合著的文章中是谁收集和处理的数据,哪些文件可供分析,以及他们是否仍然认为这些工作是可信的。Uri的研究小组计划推出一个网站,以跟踪和更新研究的最新结果。
此次Gino的学术造假事件一经揭露便掀起了轩然大波,《纽约时报》、The Chronicle of Higher Education等媒体纷纷发表相关报道,“研究不诚实的哈佛大学学者被指控伪造研究数据” “一位不诚实专家被指控欺诈”。
Gino的合作者,宾夕法尼亚大学沃顿商学院的Maurice Schweitzer教授评论道:
“这次事件之所以引起这么大的反响,是因为Gino确实是这个领域的领先学者,她有着很多的合作者,并发表了非常多的文章……”
“我们很多人都深受她在这个领域的学术研究的引领,作为合作者以及同事,这令人非常不安。”
Schweitzer还声称,Gino曾经的一些合作者,正在重新审阅他们的合作文章,以检查是否存在数据伪造的迹象。
伦敦国王学院的公共政策研究员Michael Sanders表示,他的团队花费了约25万美元,与危地马拉税务局合作开展了大规模的实地研究,试图重复Gino等人于2012年发表在PNAS上的文章,显然这些努力全都白费了。他声称:“因为我们挖错了地方。”斯沃斯莫尔学院的行为经济学家Syon Bhanot对Gino事件也表示很气愤:“我曾花了很多的时间和精力来试图重复一项现在被质疑有问题的文章”。
Gino哈佛商学院教授的头衔及其在学术界的威望,让她在其它领域也颇有影响力。她是Ted等平台上备受欢迎的演讲者。据悉,她的演讲费高达5-10万美元。Gino还出版过Rebel Talent等畅销书。此外,Gino曾被评为40岁以下的全球前40位顶尖的商科教授、世界前50最具影响力的管理学思想家,并在多家大公司担任咨询顾问。
在对Gino事件感到唏嘘和愤怒的同时,我们不得不认真思考一下,这些学术造假事件背后可能的原因。
学术造假的获益与代价不平衡
学术造假的问题早已屡见不鲜。科学家理应根据实事求是的原则来开展科学研究,但为何造假问题会层出不穷?这很可能是源于它的高收益和低成本。学术造假的代价人们不好确定,但在未被揭露时的回报却十分的明确可观。
2018年发生的一起造假事件轰动了国内外学术界,主人公竟然用造假数据开辟出一个新的研究领域。心脏干细胞领域的鼻祖级人物——哈佛教授Piero Anversa被爆数据造假,心肌干细胞根本就是无中生有。哈佛大学自查后发现确有其事,建议期刊撤回Piero Anversa发表的31篇顶刊文章。无独有偶,阿尔茨海默症的一项开山研究同样也涉嫌学术造假,该文章2006年在Nature一经发表[7],立即受到了全球卫生部门及药企的关注。但2022年Science发表的一篇调查报告指出[8],该研究存在图像造假,其第一作者Sylvain Lesné(明尼苏达大学神经学家)更是被指控在20多篇论文中均涉嫌学术造假。
然而,在谎言还没有被拆穿的时候,上述两位主人公一时之间可谓是风头无两。Piero Anversa因成功证明了心肌干细胞的存在,一跃成为了哈佛大学的终身教授,此后主持了上百个R01(美国国立卫生研究院(NIH)资助)的研究,研究经费总计超过6000万美元。Sylvain Lesné在其涉嫌造假的文章发表后,迅速成为了阿尔兹海默症领域的新星。在文章发表不到两周的时间,通讯作者Karen Ashe更是凭借这项研究拿下了阿兹海默症领域的“诺奖”——波坦金奖。海量的资金相继涌入,NIH对该项目十分重视,累计投入近16亿美元……
有的研究者正是难以抵挡名利双收的诱惑,才铤而走险地走上了弄虚作假的道路。伦敦国王学院的Michael Sanders表示,要想从根本上减少学术造假的行为,就必须改变学术界的奖励制度。Sanders提到:“如果你赢得这场比赛,奖金是巨大的,那么你作弊的动机便非常非常高。”他同时还指出,Gino一直是哈佛大学薪酬最高的教授之一。根据2019年校方披露的税务申报,Gino从哈佛和“相关组织”中获得的薪酬约为100万美元。相比于客观的收益,学术造假的代价却十分模糊,缺乏统一的判罚标准。
诚然,不少研究者的确因学术造假付出了应有的代价。前有在学术界“名留青史”的小保方晴子,因在Nature上发表了关于干细胞的论文而轰动一时。但在确认论文图像造假后,其论文被期刊撤回,博士学位亦被早稻田大学取消,她的导师笹井芳树更是不堪舆论压力选择了悬梁自尽。后有斯坦福大学校长Marc Tessier-Lavigne,近日被证实,其作为主要作者或合作者撰写的12份报告中均包含伪造信息。Essier-Lavign本人表示:尽管论文中的数据造假自己并不知情,但出于对实验室成员的负责,自己将卸任斯坦福大学校长一职。
尽管学术界对造假行为向来嗤之以鼻,但部分造假者受到的惩罚却微乎其微。Dan Ariely于两年前被指控涉嫌数据造假,但目前其仍任职于杜克大学并活跃于各类活动;Matthew Walker的睡眠实验被指学术造假,而他所在的加州大学似乎并没有对其作出处罚……对他们而言,学术造假的最终结果只是文章被撤稿,并未对其造成太多的实际性损失。
当前学术造假的代价可大可小,缺乏一个清晰而规范的惩罚准绳。如果嘴上说着零容忍,实际上的做法却是大事化小,小事化了,最终不了了之,只会越发助长造假者的投机心理。当不明确的造假代价遇上明确的造假获益,难免有些人会心存侥幸,认为自己会是那个免受惩罚,从中获益的“幸运儿”。因此,要有效减少学术造假,改变奖惩机制是有必要的。
改变奖惩机制
创造错误简单,承认错误并修正错误却绝非一件易事。针对此,社会及学术单位可以从改变奖惩制度着手。
在奖励上,可以考虑增加对举报者的奖励,以激发人们的打假勇气。比如,在著名的杜克大学学术腐败案中[9],Joseph Thomas举报她的共同作者,杜克大学的生物学家 Erin Potts-Kant 的多篇论文存在学术造假行为,从而获得3375万美元的奖励。依据美国政府出台的《联邦虚假申报法案》,一旦举报成功,违法一方需要向联邦支付最高三倍的罚款,举报者最多可分得30%的奖励。所以,Joseph Thomas能勇敢地站出来,除了道德层面的原因,也有经济上的原因。
在惩罚上,可以制定更规范细致的诚信政策并加大对学术造假的惩罚力度。当前学术界对学术造假的主要惩罚措施为学术规范处罚(期刊撤稿处理、责任人公开道歉、取消责任人学位等)、单位行政处罚(处分、开除等)以及民事处罚(罚款)等。少有地方将学术造假上升到刑事处罚的高度,但也并非没有遭遇牢狱之灾的造假者。艾滋病研究人员韩东杓(Dong-Pyou Han)所在的研究小组发现兔子体内可产生艾滋病病毒抗体,这一重大成果也获得了NIH1000万美元的研究经费。后人证明兔子血清中所含抗体为人类抗体,韩东杓实则学术造假。韩东杓因伪造研究数据、提交不实报告以获得政府资金等数项联邦重罪被起诉,最终获刑57个月,罚款720万美元,出狱后还要接受3年的管制[10]。
学术造假在多数人看来可能只是道德问题,但事件败露后如果只是“从轻发落”,无疑会让造假者们无“后顾之忧”,愈发助长学术造假的不良风气。因此,建立更严厉的惩罚机制,提高学术造假的代价,才能在相当程度上遏制学术造假的行为。
单一评价体系下的唯成果论
在学术界,诸多单位对论文发表数量和高影响因子往往有着严苛的硬性指标,这让研究者们不得不“卷起来”。这成为学术造假的另一重要原因。置身于这种环境中,一些科研工作者可能会迫于学术压力,采取伪造数据、选择性报告等不正当的手段来达到论文发表的目的。
这种做法违背了科学认识客观世界的本质——探索真理。在元分析中,偏倚的问题普遍存在,即显著的结果、新奇的发现更容易被发表出来,而阴性结果往往是不被报告的。尽管阴性结果在科学探索中十分常见,但现有的学术评价体系更钟情于阳性结果。这可能使得研究人员在解读研究结果时有意忽略客观事实,更有甚者会剑走偏锋,走上弄虚作假的道路。然而,那些通过数据造假才得以显著的结果,真的就是我们想要探索的“真理”吗?科学是一个不断探索、不断试错的过程,阴性结果的取得是再正常不过的事情。同样地,阴性结果也能够传达很多重要信息,比如:某个效应可能本身就很微小,难以被探测;某个额外的变量会干扰真实的结果;某种测量方式不够精准等。客观真理很多时候可能需要无数个阴性结果的尝试才得以被披露。显然,现存的这种“报喜不报忧”的学术评价制度是不够合理的,会让人们愈发远离真实、完整的科学全貌。因此,推动科学进步,需要看见和重视阴性结果的价值。
幸运的是,学术界已经逐渐意识到过度追求阳性结果的弊端,开始更多地关注研究过程而不仅仅是结果,这为阴性结果的论文发表迎来了一丝曙光。2023年2月22日,Nature官网宣布,Nature及其系列子刊将新增一类叫“预注册报告”(Registered Reports)的发表形式。区别于先实验后投稿的传统学术出版流程,研究者在注册报告的模式下,可以在实验开始前先提交报告。如果报告中阐述的研究问题和研究方法成功地通过了同行评审,那么不管其结果如何,Nature都承诺会发表论文的研究成果。这一做法旨在鼓励严谨性和可重复性的研究,弱化研究者对阳性结果的过分追求,转而更关注研究过程本身,以减少学术造假的可能性。
现有的学术评价体系对期刊的影响因子有着狂热的追捧。每年的期刊引证报告(JCR)一经发布,都会引发学术界对期刊影响因子的热议。诚然,影响因子是衡量期刊影响力的重要指标,也是用于评判文章质量的重要标准。但期刊的影响因子越高,就代表文章质量就越好吗?实际上,只根据影响因子给文章划分三六九等,这是一种非常简单粗暴的方法,是唯影响因子论的体现。不难发现,高影响因子的期刊上也不乏质量“没那么好”的文章,甚至还有被撤稿的文章。期刊审稿人在论文审稿时更多关注研究的创新型、逻辑性等问题,但往往没有时间和精力核实研究数据和结果本身是否真实可靠。学术合作及评审过程中遵守的是“互信”二字,但这份信任也让那些想要钻空子的研究者有机可乘。
评价一个研究的好坏,不应一味地比较现时的影响因子,更应关注内容、质量以及其长远的“生命力”。同样地,评价一个学者的水平,不应单纯地关注发文数量和期刊好坏,是否在知名期刊上发表文章,更应采用多元化的评价体系,关注个人素质。在这方面,荷兰已经作出表率[11]。比如,荷兰学术界为应对学者科研压力过大,修订了以下表彰和奖励制度:促进职业发展道路的多元化和活力;认可学者的独立性、个人素质、个人抱负和团队表现;强调成果的质量而非数量;鼓励开放科学;支持高质量的学术领导。
揭示真理、发展科学,学者们是重要的推力,而其研究是具象的工具,你我都不能打着“探寻科学”的幌子来掩盖甚至歪曲科学。
谨记,科研道路千万条,学术诚信第一条。
参考资料
[1] Kristal, A. S., Whillans, A. V., Bazerman, M. H., Gino, F., Shu, L. L., Mazar, N., & Ariely, D. (2020). Signing at the beginning versus at the end does not decrease dishonesty. Proceedings of the National Academy of Sciences, 117(13), 7103–7107.[2] Behavioural Insights Team, (2012). Applying behavioural insights to reduce fraud, error and debt. Cabinet Office, London, 185, 186.[3] Kettle, S., Hernandez, M., Sanders, M., Hauser, O., & Ruda, S. (2017). Failure to CAPTCHA attention: Null results from an honesty priming experiment in Guatemala. Behavioral Sciences, 7(2), 28.[4] Shu, L. L., Mazar, N., Gino, F., Ariely, D., & Bazerman, M. H. (2012). Signing at the beginning makes ethics salient and decreases dishonest self-reports in comparison to signing at the end. Proceedings of the National Academy of Sciences, 109(38), 15197–15200.[5] Simonsohn, U., Simmons, J., & Nelson, L. (2023, June 17). Data Falsificada (Part 1): “Clusterfake”. Data Colada. http://datacolada.org/109[6] Simonsohn, U., Simmons, J., & Nelson, L. (2021, August 17). [98] Evidence of Fraud in an Influential Field Experiment About Dishonesty. Data Colada. https://datacolada.org/98[7] Lesné, S., Koh, M. T., Kotilinek, L., Kayed, R., Glabe, C. G., Yang, A., … & Ashe, K. H. (2006). A specific amyloid-β protein assembly in the brain impairs memory. Nature, 440(7082), 352-357.[8] Piller, C. (2022, July 21). BLOTS ON A FIELD? Science. https://www.science.org/content/article/potential-fabrication-research-images-threatens-key-theory-alzheimers-disease[9] Duke University settles research misconduct lawsuit for $112.5 million.(2019, March 25). Science. https://www.science.org/content/article/duke-university-settles-research-misconduct-lawsuit-1125-million[10] Bernstein, R. (2015, July 6). HIV researcher found guilty of research misconduct sentenced to prison. Science. https://www.science.org/content/article/hiv-researcher-found-guilty-research-misconduct-sentenced-prison[11] Room for everyone’s talent (2019, November). Universiteiten van Nederland. https://www.universiteitenvannederland.nl/recognitionandrewards/wp-content/uploads/2019/11/Position-paper-Room-for-everyone%E2%80%99s-talent.pdf
出品:科普中国