2024Nature最新心理学文章—未来已来,当AI和人类合为一体

宝子们,带大家来读文献了!未来已经来到,当人类和AI合为一体时,我们应该怎么办呢?今天精选的这篇会给你带来很多思考。

期刊:Nature Human Behavior

题目:当人类和人工智能的组合有用时——系统回顾和荟萃分析

在当今科技飞速发展的时代,人工智能(AI)已经广泛应用于各个领域,从医疗诊断到创作内容,从自动化制造到客户服务。随着AI的能力不断增强,越来越多的人开始思考一个问题:人类和AI合作,是否能够比单独依赖其中之一更有效?这个问题引发了大量研究,探索人类和AI结合的最佳场景和潜力。尽管已有很多关于人类与AI合作的研究,但我们依然缺乏一个系统的理解,具体在哪些任务和情境下,人类与AI的合作能够真正带来优势。

为了填补这一空白,本文对106项实验研究进行了系统回顾和元分析,涵盖了370个效应值。这些研究比较了人类、AI单独执行任务以及人类与AI合作执行任务的表现。通过分析这些实验的结果,本文旨在揭示人类和AI合作的效果如何,在哪些类型的任务中合作表现较好,在哪些情况下合作可能反而表现不佳。

通过这一分析,本文不仅希望为人类和AI合作提供更清晰的理解,也为未来如何设计更有效的AI系统提供有益的见解。

摘要:

受人工智能(AI)日益广泛应用于增强人类能力的启发,研究人员已开始研究涉及不同任务、系统和人群的人工智能与人类系统。尽管已有大量相关研究,但我们对何时人类与AI的组合优于单独的两者之间的概念理解仍然缺乏全面的认识。在本研究中,我们通过进行一个预注册的系统性综述和元分析,探讨了这一问题,共纳入106项实验研究,报告了370个效应量。我们在跨学科的数据库(如计算机协会数字图书馆、Web of Science和信息系统协会电子图书馆)中搜索了2020年1月1日至2023年6月30日之间发表的相关研究。每项研究都必须包括一个原始的以人为参与者的实验,评估人类单独、AI单独以及人类与AI组合的表现。

首先,我们发现,平均而言,人类与AI的组合表现显著低于最佳的人类或AI单独使用(Hedges’ g = −0.23;95%置信区间,−0.39 至 −0.07)。其次,我们发现,在涉及决策的任务中表现较差,而在涉及创作内容的任务中,表现显著提高。最后,当人类的表现优于AI时,组合的表现有所提升;而当AI优于人类时,组合表现则有所下降。所评估的证据的局限性包括可能的发表偏倚和分析的研究设计的差异。

总体而言,这些发现凸显了人类与AI合作效果的异质性,并指向了改善人类–AI系统的有前景的研究方向。

Abstract

Inspired by the increasing use of artificial intelligence (AI) to augment humans, researchers have studied human–AI systems involving different tasks, systems and populations. Despite such a large body of work, we lack a broad conceptual understanding of when combinations of humans and AI are better than either alone. Here we addressed this question by conducting a preregistered systematic review and meta-analysis of 106 experimental studies reporting 370 effect sizes. We searched an interdisciplinary set of databases (the Association for Computing Machinery Digital Library, the Web of Science and the Association for Information Systems eLibrary) for studies published between 1 January 2020 and 30 June 2023. Each study was required to include an original human-participants experiment that evaluated the performance of humans alone, AI alone and human–AI combinations. First, we found that, on average, human–AI combinations performed significantly worse than the best of humans or AI alone (Hedges’ g = −0.23; 95% confidence interval, −0.39 to −0.07). Second, we found performance losses in tasks that involved making decisions and significantly greater gains in tasks that involved creating content. Finally, when humans outperformed AI alone, we found performance gains in the combination, but when AI outperformed humans alone, we found losses. Limitations of the evidence assessed here include possible publication bias and variations in the study designs analysed. Overall, these findings highlight the heterogeneity of the effects of human–AI collaboration and point to promising avenues for improving human–AI systems.

女王学堂,纯女性创业组织,海外在读PhD+上市公司/教育机构前经理组合,每天分享一篇最新高质量期刊文章,关注我们,随时随地读paper。助你一路硕博。

想要了解更多留学资讯,欢迎点击下方私信我们!

限时免费评估院校!查看原文链接获取全文

资源下载: