国内机器翻译译后编辑研究:现状、问题与展望

摘要:近年来,随着神经网络机器翻译技术的广泛应用,机器翻译译后编辑成为国内翻译技术研究的热点。然而当前国内机器翻译译后编辑研究似乎进入了一个“瓶颈期”,亟需学界对已有研究进行全面的梳理和总结。本研究以1995—2022年间中国知网(CNKI)收录的机器翻译译后编辑领域相关文献为数据来源,借助CiteSpace(5.1.R8)文献计量分析软件进行可视化分析,通过考察研究作者、研究机构、关键词等,梳理国内机器翻译译后编辑的研究现状。研究结果表明:国内机器翻译译后编辑研究起步较晚,研究热点集中在译后编辑概述、译后编辑工具的开发与应用、译后编辑在翻译实践中的应用分析、译后编辑能力与译后编辑人才的培养。针对当前国内机器翻译译后编辑研究中存在的问题,文章对其应用领域、实证研究、人才培养进行了展望。

关键词:CiteSpace;机器翻译;译后编辑;研究热点

文献来源《民族翻译》2022年第4期,第68-76页。推送已获作者授权,引用请以期刊版为准。

作者简介肖志清,男,汉族,武汉科技大学外国语学院讲师,硕士生导师。主要研究方向:翻译技术、笔译理论与实践。金鸣,女,汉族,武汉科技大学外国语学院MTI研究生。主要研究方向:笔译理论与实践。

基金项目:本文系武汉科技大学教学研究项目“人工智能翻译背景下翻译专业学生译后编辑能力培养模式研究”(2019×066)的阶段性成果。

编辑:周方衡

随着翻译研究出现技术转向,翻译研究表现出明显的跨学科甚至超学科特点[1]。作为机器翻译与翻译研究的交叉点,译后编辑引起了国内不同领域学者的关注,并对其展开研究。相对于20世纪80年代中期国外肇始的译后编辑研究[2],国内的译后编辑研究起步较晚,最早的译后编辑研究是中国科学院计算机语言信息工程研究中心的黄河燕、陈肇雄于1995年撰写的《一种智能译后编辑器的设计及其实现算法》,旨在从工程领域研究译后编辑工具的设计和开发。此后20年间(1995-2015)仅有为数不多的19篇论文。而国内翻译学界直到21世纪初才开始关注译后编辑研究,标志性成果是魏长宏、张春柏2007年在《中国科技翻译》发表的概述性论文《机器翻译的译后编辑》。2015年后,国内译后编辑研究论文的发文量逐年增多,但研究主题不够广泛,多为与译后编辑相关的MTI翻译实践报告学位论文,缺乏高水平的期刊文献。这一方面说明机器翻译译后编辑模式应用越来越广泛,另一方面也说明译后编辑研究趋于同质化,创新性研究偏少,可以说当前国内机器翻译译后编辑研究似乎进入了一个“瓶颈期”。鉴于此,笔者认为有必要对国内译后编辑研究进行全面的梳理和总结。尽管目前国内已有译后编辑研究的综述,但有些侧重于综述译后编辑工具的研究现状[3],有些则基于文献阅读法,没有采用可视化知识图谱进行系统的描述[4],缺少完整时间跨度、较大文献范围且结合多个知识图谱的可视化文献计量分析研究。为此,本文借助CiteSpace文献计量分析软件,基于中国知网(CNKI)数据库的相关文献,从文献计量角度对1995年以来国内机器翻译译后编辑研究的研究作者、研究机构、研究热点及其演变、研究领域与前沿进行探究,旨在廓清国内译后编辑研究的现状与不足,为国内译后编辑的进一步深入研究提供新视角新方法。


一、研究设计

1.数据来源
本文研究数据源自中国知网数据库。以“译后编辑”为检索主题,发现国内有关译后编辑的研究最早出现在1995年。鉴于数据的普遍性和代表性,未设定具体文献范围及来源,时间跨度设为1995-2022年,检索后得到文献326篇,数据库检索时间是2022228日。经过人工筛选和去重,剔除标准类文献以及与本研究无关或相关度较低的文献,得到有效文献319篇。

2.研究工具和方法
本研究基于文献计量学方法,以美国知名学者陈超美开发的可视化分析软件CiteSpace为分析工具CiteSpace是一款多元、分时、动态的引文可视化分析软件,能够将一个知识领域的来龙去脉和演进历程集中展现在一幅引文网络图谱上,并能把图谱上作为知识基础的引文节点文献和共引聚类所表征的研究前沿自动标识出来[5]。将上述筛选出的319篇文献以Refworks格式从中国知网导出,导入至CiteSpace 5.1.R8软件中,时间切片(Time Slicing)设置为“From 1995 Jan To 2022 Feb”,年份切片(Year Per Slice)设置为3,选取研究作者、研究机构、关键词作为可视化研究对象,分析和归纳1995-2022年国内译后编辑的研究现状。

二、研究结果

1.主要研究作者
运行CiteSpace,节点类型选择Author,从而生成国内译后编辑研究者共现图谱(图1),并根据CiteSpace软件统计结果得出1995-2022年间国内译后编辑高产研究者发文量及首发文年份表(表1)。分析作者发文量及其合作情况有助于洞悉该研究领域的代表人物,了解总体研究现状。


图谱中作者名的字体大小与发文量呈正相关。由图1和表1可见,国内译后编辑研究者整体上发文量偏少,相对高产的作者有冯全功、王湘玲、李梅、崔启亮、王华树等,他们是该研究领域的代表人物。其次,图谱节点间连线能够反映作者间合作关系,连线粗细与合作程度呈正相关。译后编辑领域的研究者关系具有小集中、大分散的特点,某些学者之间形成了小的学术共同体,翻译学界主要是冯全功与张慧玉、崔启亮、朱晗汐等人之间的合作较为密切;王湘玲与贾艳芳、李梅与朱锡明、王华树与李智、陈涅奥等人之间也存在合作关系,但整体上各作者分布较为分散和孤立,尤其是计算机自然语言处理研究界和翻译学界的合作发表很少,仅有江西师范大学的裘白莲、王明文和李茂西等人存在跨学科合作,这说明国内译后编辑研究的跨学科特性不明显,未形成跨学科合作的局面。


2.主要研究机构
节点类型选择Institute,通过CiteSpace可视化分析软件绘制出高产研究机构共现图谱(图2),并将数据导出用Excel统计出高产研究机构发文量及首发文年份表(表2)。统计过程中发现有些研究机构以二级单位发表文章,因此将属于同一研究机构的二级单位发文量进行合并,然后进行排序。


图谱中机构名称的字体大小与其发文量呈正相关,连线表示机构间具有合作关系。由图2和表2可见,相对高产的研究机构有浙江大学、同济大学、对外经济贸易大学等高校,发文数量均在4篇(含4篇)以上,但更多的研究机构只有1-2篇的发文量。图谱密度为0.0043,说明整体上国内研究译后编辑的各研究机构间无密切的合作关系,研究机构的跨地域合作较少,相对合作较多的院校为浙江大学,研究具有差异化;高产的研究机构一定程度上与高产研究者相呼应,如冯全功就职于浙江大学,他的发文量与浙江大学的发文量正好吻合,侧面说明译后编辑研究相对集中于某个学者或某个机构,研究群体和研究机构分布不均匀。


3.研究热点及其演变
“关键词是论文内容的提炼及浓缩,如果一段时间内某一关键词在特定文献中反复出现,则该关键词所表征的研究课题就是该领域的研究热点”[6]。通过关键词共现图谱,能够查看该领域的高频关键词,图中圆圈大小代表着关键词的频次,频次越多,节点的圆圈越大;不同的关键词若在同一篇文章中出现过,两者之间便会有一条连线,连线越粗,代表关键词间的关系越紧密。运行CiteSpace软件,节点类型选择keywords,经算法统计得出关键词共现图谱(图3)。


如图3,主要节点共有67个,84次连接,密度为0.038,说明机器翻译译后编辑研究具有较高的集中性,形成了“译后编辑”“机器翻译”两大主核、“计算机辅助翻译”“译后编辑策略”“译前编辑”等若干次核的研究方向,这些核心关键词之间相互连接,关系密切,有较多的研究分支,具有一定的学科交叉性,但同时又各自形成较小的研究体系。

与主题密切相关的“译后编辑”“机器翻译”“计算机辅助翻译”“翻译技术”关键词体现了译后编辑领域研究的重点,覆盖的研究方向众多,故而其频次和中心性都较高。这些关键词强调了译后编辑研究的技术性和理论性,如何在技术层面提升译后编辑效率,更好地进行人机协作一直是译后编辑领域研究的重点,贯穿了译后编辑发展的整个过程。
译后编辑的研究主要集中在“译后编辑原则”“译后编辑策略”“译后编辑方法”“译后编辑能力”等方面,说明国内学者关注的是译后编辑的原则、方法和策略等问题,这些是译后编辑能力培养的重要方面;译后编辑在不同文体翻译的应用研究方面,从图3可见“经济类文本”“技术类文本”“报告类文本”“科技文本”“学术文本”“合同文本”“新闻翻译”“专利翻译”“影视文本翻译”等关键词,说明译后编辑在翻译实践层面多应用于应用文体文本,而较少应用于文学翻译领域。
为进一步观察1995-2022年间国内译后编辑研究主题在不同时期的演化脉络,在关键词共现的基础上CiteSpace绘制了译后编辑研究关键词时区图谱(图4),图谱中每个研究节点代表了国内译后编辑研究热点关键词,研究节点的线条跨度和密度清晰呈现了译后编辑研究的研究走向和主题变迁。分析图谱可知:首先,译后编辑越来越受到国内学者的关注。2016年以前,时区图内的坐标数量很少,节点稀疏零散,而自2016年起,节点数量大幅增多,到了2022年更加密集,可见译后编辑研究自2016年起出现了一股研究热潮。其次,译后编辑研究主题范围更加广泛。在2016年以前,围绕译后编辑进行的主题研究仅限于计算机辅助翻译、人工翻译以及维汉/汉维机器翻译等少数几个维度,而2016年后,时区图内出现了译后编辑原则、译后编辑策略和方法、译后编辑模式、译后编辑能力、学生译者、错误识别等主题词,这说明译后编辑的应用研究获得了翻译学界的重视,研究焦点逐渐从译后编辑技术转向译后编辑能力、译后编辑人才培养以及译后编辑结果改进。再次,译后编辑研究趋于同质化。2016-2022年间,时区图中出现专利翻译、报告类文本、科普文本、科技文本等关键词,说明在此阶段译后编辑与翻译实践紧密结合,且译后编辑多应用于技术型或应用型文本。采用研究模式多为:针对某类/个具体文本进行“机器翻译+译后编辑”分析研究,这类研究以翻译硕士的翻译实践报告为主。


4.研究领域与前沿

关键词聚类图谱能够反映当前研究主题的主要研究领域和方向,挖掘当前的研究热点。衡量聚类结构合理性的两个重要参数为聚类模块值Q和聚类平均轮廓值S,一般而言,Q>0.3就意味着划分出来的社团结构是显著的,当S在0.7时,聚类高效且令人信服[5]。1995-2022年间国内译后编辑研究关键词聚类结果显示,Q值为0.7199,S值为0.7961,由此可见,本研究主题聚类结构合理。

聚类图谱(图5)显示,1995-2022年间国内译后编辑研究形成了8个聚类,依次为:#0维汉机器翻译、#1人工翻译、#2经济类文本、#3计算机辅助翻译、#4译后编辑策略、#5神经网络机器翻译、#6错误识别、#7译前编辑。顺序从07,数字越小,聚类中包含的关键词越多。为探索各聚类间的关系,对各聚类进行重新整合,得出两大主要研究路径:翻译技术与译后编辑、译后编辑的应用和发展。翻译技术与译后编辑包括了聚类#0维汉机器翻译、#3计算机辅助翻译、#5神经网络机器翻译、#6错误识别,自1995年以来,国内不乏有学者在机器翻译的基础上进行译后编辑相关的研究,他们从翻译技术的角度出发思考如何改进译后编辑。对机器翻译的结果进行错误识别,一定程度上为译后编辑技术研究提供了数据和基础。如罗季美、李梅对机器译文与人工译文进行对比,描述了机器翻译在词汇、句法等翻译处理方面的典型错误形式,并通过补充建立形式化规则、限定词汇范畴,为机器翻译系统提供反馈[7]译后编辑的应用和发展包括了#1人工翻译、#2经济类文本、#4译后编辑策略、#7译前编辑。译后编辑在翻译实践中具有广泛应用,但目前译后编辑多应用于经济文本、科技文本、信息文本等应用型文本。一方面,因为不同题材文本对翻译质量的要求差异,应用型文本主要以信息型文本为主,隐喻以及文化负载词较少,一般只需直观忠实地传递信息,采用译后编辑不仅可以提高效率,也进一步确保了译文质量。另一方面,随着全球化的发展,各国之间经济、科技、贸易等交流最为频繁,经济文本、科技文本等在翻译市场中占比较大,这也促成了译后编辑多应用于应用型文本的现状。译后编辑也不排除译前编辑,两者都是提高机器翻译质量的重要手段,充分的译前编辑能够有效减少译后编辑人员的工作量。因此,广义上而言,译前编辑也是译后编辑的有机组成部分[8]。如何将受控语言应用于译前编辑以及探索基于受控语言的英汉/汉英翻译的译前编辑技巧都可作为译后编辑研究的重要话题。同时,在运用译后编辑进行翻译实践的过程中,国内学者也逐渐开始思考译后编辑的实证对比研究和教学研究,比如译后编辑距离、功能和效率的对比[3];人工翻译与译后编辑的对比实证研究[9-10];译后编辑能力界定、译后编辑课程设置与译后编辑人才培养[4][11]等。突现关键词是在短时间内受到较大关注的关键词,能够展现研究的发展趋势以及研究前沿。基于导入的论文数据,运行CiteSpace关键词突现检测算法,得出1995-2022年国内译后编辑研究关键词突现图谱,表3为排名前十的突现关键词。由此可见,最早突现的关键词“机器翻译”出现在1995年,时间持续至2011年,研究周期较长,说明机器翻译研究早于译后编辑,是译后编辑的前提和基础。2016-2020年这5年时间里,突现关键词的数量占整体数量的一大半,说明在此时期内国内译后编辑的创新性研究不断涌现,研究领域和主题进一步扩大,例如有学者从认知角度对人工翻译和译后编辑的认知努力进行了眼动实验研究[12]2016年以来,翻译技术的发展和神经网络机器翻译的广泛应用提高了译文的质量,加之经济发展带来的人力成本上升,使得机器翻译+译后编辑的人机合作翻译模式成为常态[13],因而也引起了翻译学界的重视。



三、
问题与展望


在翻译数字化和产业化时代,基于机器翻译的译后编辑已成为翻译行业发展的新常态。机器翻译译后编辑模式为语言服务企业带来了新的机遇,给翻译教育添加了新的内容,给翻译技术研究增加了新的研究角度和维度。但是,目前国内机器翻译译后编辑研究仍存在如下问题:一是译后编辑大多应用于非文学文本,应用领域较为单一;二是译后编辑过程的认知研究因为实验技术手段等原因,实证研究成果偏少;三是译后编辑能力和译后编辑人才培养的教学设计和实施较少,译后编辑教学和人才培养研究仍处于理论探讨层面。
鉴于此,译后编辑研究者未来应根据跨学科翻译研究的特点,不断拓宽译后编辑理论研究和应用研究的范畴和领域。首先,加强译后编辑在文学类图书翻译的可行性研究。当前,使用机器翻译译后编辑模式翻译人文社科类图书文本正在成为一种创新尝试,探索该模式应用于更多文学翻译体裁或领域(如网络小说、历史书信)的可行性,是目前国内外译后编辑研究颇受争议、但又极具理论意义和应用价值的研究话题。其次,进一步开展译后编辑认知加工的实证研究。当前的国内译后编辑研究相对落后,多为介绍性和应用性[14],未来翻译学界应将思辨研究和实证研究相结合,深入开展译后编辑过程的认知研究,如针对各类隐喻译后编辑过程的认知努力研究、译后编辑注意力资源分配、人工翻译与译后编辑在翻译速度、译文质量、译者态度等方面的对比实证研究、译后编辑错误自动化识别和处理等。同时,研究方法上可以更加多样化,保证译后编辑研究的科学性和客观性,如采用实验心理方法、键盘日志、眼动追踪、屏幕录制等计算机辅助技术方法以及神经科学方法[15]。最后,随着人工智能的发展,语言服务行业技术化特征得到加强,突破了原有的翻译对象、翻译主体、翻译模式以及翻译环境,翻译职业化迅速发展,也激发了该行业对于译后编辑人才的需求,因此,“国内相关业界与学界应顺应信息化发展趋势,努力为推动国内机器翻译译后编辑理论模型构建与翻译人才培养做出贡献”[10]124,翻译行业相关市场主体,如语言服务和语言技术提供商,应进一步开展多种形式的译后编辑职业教育和培训,而语言服务需求方,即客户方企业和个人,也应理性看待并逐步接受机器翻译译后编辑这一翻译生产模式;翻译学界不仅要重视相关主体机器翻译素养的提升[16],还要加强译后编辑校本在线课程的开发和建设,或与企业共建译后编辑在线课程,做到资源互补,校企共赢[4],以满足全球语言服务行业对译后编辑人才的需求
此外,国内机器翻译译后编辑研究还应重视译后编辑的人机交互模式及其伦理问题。当前,单向的译后编辑模式仍然占据主流,但“人机交互是译后编辑最主要的表征”[17],未来翻译学界与机器翻译研究者可以共同探索人机交互的技术框架与合作模式,提升译员与机器间的深度交互,同时也不能忽略“人机关系”下更为深层复杂的“人人关系”,对人机、人人互动中可能出现的伦理道德及社会性问题也应保持高度敏感,以此更好地推动数字时代翻译服务的发展。[18]

四、结语
随着神经网络机器翻译技术的迅猛发展,机器翻译译后编辑逐渐成为国内语言服务行业主流的翻译生产模式,与之相关的译后编辑研究也方兴未艾。通过梳理1995-2022近三十年国内机器翻译译后编辑研究的发展脉络,可以发现,与发轫于上世纪80年代中期的国外译后编辑研究相比,国内翻译学界对译后编辑的研究虽然取得了一定的成绩,但研究整体上有些滞后,在研究主题、研究对象和研究方法上还存在诸多不足。译后编辑研究已成为当前翻译技术研究亟需面对的现实问题和前沿问题。翻译学界今后可以拓宽研究主题和研究对象,丰富研究方法,进一步深化机器翻译译后编辑的理论研究和应用研究。

参考文献:

[1]韩子满.跨学科翻译研究:优劣与得失[J].外语教学,2018(6).

[2]张慧玉,冯全功.关注行业发展 开拓译学领域——《机器翻译的译后编辑:过程与应用》评介[J].中国翻译,2016(2).

[3]周兴华,李懿洋.计算机辅助翻译软件的译后编辑功能探究[J].北京第二外国语学院学报,2021(5).

[4]肖志清.图书翻译项目驱动的译后编辑能力培养模式研究[J].北京第二外国语学院学报,2021(5).

[5]陈悦,陈超美,刘则渊, 等. CiteSpace知识图谱的方法论功能[J].科学学研究,2015(2).

[6]刁洪.国内翻译技术研究综述[J].北京第二外国语学院学报,2017(6): 73.

[7]罗季美,李梅.机器翻译译文错误分析[J].中国翻译,2012(5).

[8]冯全功,高琳.基于受控语言的译前编辑对机器翻译的影响[J].当代外语研究,2017(2).

[9]王湘玲,王婷婷.人工翻译与机器翻译译后编辑对比实证研究[J].外国语言与文化,2019(4).

[10]王湘玲,赖思,贾艳芳.人工翻译与神经网络机器翻译译后编辑比较研究——基于对隐喻翻译的眼动追踪与键盘记录数据[J].外语教学理论与实践,2021(4).

[11]仲文明,舒超.译后编辑的能力结构与课程设置——基于国外译后编辑课程的前沿分析[J].外语电化教学,2020(6).

[12]卢植,孙娟.人工翻译和译后编辑中认知加工的眼动实验研究[J].外语教学与研究, 2018(5).

[13]肖志清,魏光凤.人机交互理念下CAT+MT+PE师生协同翻译模式探索,语言教育,2021(2).

[14]冯全功,崔启亮.译后编辑研究:焦点透析与发展趋势[J].上海翻译,2016(6).

[15]王华树,刘世界.人工智能时代翻译技术转向研究[J].外语教学,2021(5).

[16]王少爽.机器翻译素养的概念内涵与表现形式——代主持人语[J].语言教育, 2021(2).

[17]王湘玲,贾艳芳. 21世纪国外机器翻译译后编辑实证研究[J].湖南大学学报(社会科学版), 2018(2):85.

[18]朱含汐,冯全功.人机合作视域下的“翻译修改”新探——《翻译修改与译后编辑:行业实践和认知过程》评介[J].外语电化教学,2022(1).

特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。

– END –

转载来源:翻译研究动态

转载编辑:刘凯

审核:王贇 李莹 张启雯 曾健彬

资源下载: