從“人工翻譯”到“人機(jī)共譯”, 生成式AI時代百度如何為翻譯留下新注解?
智東西
作者 | 程茜
編輯 | 漠影
ChatGPT風(fēng)靡,它展現(xiàn)出來的能力讓一些崗位面臨危機(jī)感,內(nèi)容創(chuàng)作工作者首當(dāng)其沖。這之中,翻譯人員作為典型的文字工作者,如何在大模型時代快速擁抱技術(shù),變“恐懼”為動力?AI的颶風(fēng)會顛覆翻譯行業(yè)嗎?
智東西4月3日報道,今天下午,在2023中國翻譯協(xié)會年會上,首屆全國翻譯技術(shù)大賽正式啟動。前沿技術(shù)突飛猛進(jìn)的當(dāng)下,翻譯工作者的工作模式發(fā)生了“翻天覆地”的變化。
“首屆全國翻譯技術(shù)大賽”正式啟動
大賽由中國外文局、全國翻譯專業(yè)學(xué)位研究生教育指導(dǎo)委員會指導(dǎo),中國翻譯協(xié)會、中國外文局翻譯院、大連外國語大學(xué)主辦,百度翻譯作為承辦單位之一。
作為首個如此高規(guī)格的全國翻譯技術(shù)大賽,與此前的翻譯比賽不同,本次大賽聚焦譯后編輯能力考查。除了以選手的翻譯結(jié)果好壞作為評判標(biāo)準(zhǔn)外,本次比賽還會以百度智能文檔翻譯平臺相關(guān)技術(shù)和產(chǎn)品為工具,增加了對選手使用機(jī)器翻譯技術(shù)的評判。
當(dāng)下誕生的文心一言、ChatGPT等生成式AI產(chǎn)品背后都是依靠深度學(xué)習(xí)技術(shù)和大模型技術(shù)的發(fā)展,這些技術(shù)和產(chǎn)品正在對各行各業(yè)產(chǎn)生各種各樣的深刻影響,翻譯行業(yè)同樣如此,前沿技術(shù)正在改變這一行業(yè)的工作范式, 科技賦能翻譯行業(yè)、賦能國家翻譯能力建設(shè)已是大勢所趨,“人機(jī)共譯”創(chuàng)新工作模式亦是中國超500萬譯者需要重點(diǎn)關(guān)注的趨勢。
一、AI技術(shù)+翻譯的平衡點(diǎn),人機(jī)共譯成為趨勢
前有能聊天、能撰稿、能翻譯、輔助創(chuàng)作的先進(jìn)生產(chǎn)力工具ChatGPT、文心一言,后有微軟、谷歌將大型語言模型集成至辦公全家桶,內(nèi)容創(chuàng)作工作者的工作方式正在被重塑。這也讓很多打工人發(fā)出疑問,“未來,我的工作會不會被AI替代?”。
與此同時,機(jī)器翻譯技術(shù)的進(jìn)步一直與翻譯人員是否會被取代如影隨形,毋庸置疑,隨著技術(shù)的進(jìn)步,機(jī)器翻譯的效果會越來越趨向于專業(yè)人士翻譯的高質(zhì)量內(nèi)容,但與專業(yè)的翻譯人員相比,在短期內(nèi)這種差距不會消失。
在這一背景下,一個關(guān)鍵問題擺在翻譯行業(yè)面前,機(jī)器翻譯和純?nèi)斯しg的模式應(yīng)該如何共存?回答這個問題,我們需要從目前這兩種翻譯模式的優(yōu)缺點(diǎn)說起。
純?nèi)斯しg的優(yōu)勢在于翻譯的流暢度、還原度都有較高保障,但相比于“以秒為單位速出結(jié)果”的機(jī)器翻譯來說,人工翻譯的時間成本更高,再加上前沿技術(shù)的發(fā)展誕生了越來越多的各行各業(yè)專業(yè)名詞,翻譯人員的學(xué)習(xí)壓力也進(jìn)一步加重。
因此,機(jī)器翻譯技術(shù)的極速發(fā)展給人工翻譯帶來了一定緊迫感。
另一方面,機(jī)器翻譯除耗時短外,還能通過模型自學(xué)習(xí)涵蓋不同行業(yè)的專業(yè)知識,對于新信息的接收速度更快。不過,人們對于機(jī)器翻譯的不信任感仍然存在,且有大量實際研究證明,機(jī)器翻譯對于語言中的情感理解、文字組織能力都有一定欠缺。
綜合來看,純?nèi)斯しg與機(jī)器翻譯可以實現(xiàn)優(yōu)勢互補(bǔ),人機(jī)共譯的新翻譯模式應(yīng)運(yùn)而生。
這種翻譯模式的出現(xiàn),不僅革新了翻譯人員的工作模式,也給翻譯行業(yè)提出了新的注解,其在機(jī)器翻譯與人工翻譯之間找到了一個更好的平衡點(diǎn),合理運(yùn)用前沿技術(shù)的基礎(chǔ)上保證翻譯的質(zhì)量。
由此可見,諸如機(jī)器翻譯等前沿技術(shù)的發(fā)展并不是一定要顛覆整個翻譯行業(yè),而是轉(zhuǎn)變成輔助人工的生產(chǎn)力工具,作為一種能有效提升人工效率的存在。
二、百度智能文檔翻譯平臺化身先進(jìn)生產(chǎn)力工具
翻譯行業(yè)從業(yè)者工作模式的變革,必然伴隨著工具的進(jìn)一步革新。
以此次大賽為例,百度翻譯為大賽提供翻譯技術(shù)和比賽平臺支持,參賽選手采用百度智能文檔翻譯平臺提供的技術(shù)和服務(wù),這一平臺是以機(jī)器翻譯為核心的新一代智能自學(xué)習(xí)文檔翻譯平臺,可謂是人機(jī)共譯工作范式下的工具集大成者。
首屆全國翻譯技術(shù)大賽官網(wǎng)-百度智能文檔翻譯平臺
人機(jī)共譯模式下,翻譯人員做的工作更像是成為機(jī)器翻譯文本的編輯,因此,人機(jī)共譯模式不僅要考察機(jī)器翻譯能力,更為重要的是人與機(jī)器的協(xié)作是否流暢、便捷。
1、囊括4萬+個翻譯方向,能化身各行業(yè)“翻譯專家”
百度智能文檔翻譯平臺支持全球200多個語言互譯、超4萬個翻譯方向,并且擁有學(xué)術(shù)、新聞、生物醫(yī)藥、金融財經(jīng)等多個專業(yè)領(lǐng)域翻譯模型,使得翻譯效率提升100% ,在專業(yè)領(lǐng)域該平臺的翻譯準(zhǔn)確率超過90%。
當(dāng)在翻譯平臺上傳關(guān)于學(xué)術(shù)期刊和機(jī)器人研究的相關(guān)文章時,百度智能文檔翻譯平臺的翻譯速度并沒有受到文章翻譯類型等影響。在描述“軟體機(jī)器人模擬毛蟲運(yùn)動方式”時,其文字部分使用短句將英文中的長句分開,更符合中文的閱讀習(xí)慣。
上為“機(jī)器人”相關(guān)PDF文件,下為“學(xué)術(shù)論文”研究相關(guān)Word文件
2、支持多類型文檔上傳,支持實時編輯+格式一比一對應(yīng)
該平臺對于上傳的文檔限制較小,支持Word、Excel、PPT、PDF等多種格式文檔。
進(jìn)入翻譯工作臺后,該平臺會為用戶提供整頁預(yù)覽和逐句對照兩種模式,右上角會有編輯譯文與導(dǎo)出按鈕,方便翻譯人員對其中部分措詞進(jìn)行修改、完善。
并且對于PDF版本的學(xué)術(shù)論文,其譯文界面還會完全對照原文的格式。
3、6大一級領(lǐng)域+40個二級領(lǐng)域,權(quán)威高效的專業(yè)術(shù)語
還有一點(diǎn)與其他翻譯工具不同的是,這一平臺內(nèi)置了百度翻譯術(shù)語庫和全國名詞委術(shù)語庫。在提交文檔界面,該平臺會為用戶提供“術(shù)語提示”功能,其中包含工程科學(xué)、基礎(chǔ)科學(xué)、生物醫(yī)藥等6個一級領(lǐng)域及40個二級領(lǐng)域,基本覆蓋有翻譯需求的不同行業(yè)。
翻譯人員遇到更為前沿的學(xué)科內(nèi)容或不熟悉的技術(shù)領(lǐng)域時,這一工具可以為翻譯人員提供相關(guān)參考,省去翻譯人員額外檢索查證的時間。
即使前期沒有選擇相應(yīng)“術(shù)語參考”領(lǐng)域,智能文檔翻譯平臺也會根據(jù)用戶劃詞的內(nèi)容去定位相應(yīng)行業(yè)。
4、機(jī)翻+譯后+自學(xué)習(xí),翻譯助手“專業(yè)性”漸趨人類
如一些專有名詞通常在論文中會有英語簡寫表述,但很多情況下這些專有名詞在不同行業(yè)中的意義完全不同。以GPT這個詞為例,在AI領(lǐng)域其意義是文本生成模型,而在醫(yī)藥領(lǐng)域GPT是谷丙轉(zhuǎn)氨酶。
比如,如果翻譯人員有特定研究領(lǐng)域,且相關(guān)專有名詞有一定的重復(fù)性,在編輯譯文的過程中,智能文檔翻譯平臺還會根據(jù)用戶修改的譯文進(jìn)行自學(xué)習(xí),并在之后的翻譯文件中優(yōu)化翻譯結(jié)果,使得機(jī)器翻譯的結(jié)果與理想譯文不斷趨近。
綜上所述,百度智能文檔翻譯平臺將機(jī)器翻譯(MT)、譯后編輯(PE)、模型自學(xué)習(xí)納入其翻譯體系,能夠大幅提升人機(jī)共譯模式的工作效率及效果。
百度智能文檔翻譯平臺與人工翻譯、機(jī)器翻譯兩種模式的契合,使其成為人機(jī)共譯時代的“重量級”先進(jìn)生產(chǎn)力工具。
三、十余年AI全棧技術(shù)布局,深度學(xué)習(xí)、大模型提升機(jī)翻流暢、準(zhǔn)確度
從更宏觀的角度來看,機(jī)器翻譯概念誕生至今已經(jīng)超過70個年頭,隨著深度學(xué)習(xí)及大模型技術(shù)的發(fā)展,這一技術(shù)的產(chǎn)業(yè)化格局正在被重塑。
此次2023中國翻譯協(xié)會年會4月4日的翻譯技術(shù)主題論壇上,百度翻譯還將聯(lián)合中國外文局翻譯院、中國翻譯協(xié)會翻譯技術(shù)委員會共同發(fā)布《2023機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書》。
《2023機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書》
技術(shù)的發(fā)展正在為翻譯行業(yè)注入新鮮血液,隨著機(jī)器翻譯技術(shù)的不斷變革,主流機(jī)器翻譯方法也在不斷迭代。在深度學(xué)習(xí)技術(shù)發(fā)展的背景下,能模擬人類翻譯過程的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯出現(xiàn),2015年百度發(fā)布全球首個互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng),使得翻譯效果在語言表示、語義理解和譯文生成等方面都有顯著提升。
面向未來,正如藍(lán)皮書所說,以ChatGPT、文心一言(ERNIE Bot)為代表的新一代預(yù)訓(xùn)練模型技術(shù)在語言理解與生成,特別是低資源、長篇章以及多模態(tài)的場景應(yīng)用中表現(xiàn)出強(qiáng)大能力和發(fā)展?jié)摿Γc人的互動性和反饋學(xué)習(xí)能力不斷增強(qiáng)。
因此,機(jī)器翻譯在當(dāng)下已經(jīng)呈現(xiàn)出強(qiáng)大的產(chǎn)業(yè)化生命力。該技術(shù)在企業(yè)智能化升級、行業(yè)數(shù)字化建設(shè)等場景中的應(yīng)用正在不斷普及。以中石化全球戰(zhàn)略為例,百度企業(yè)級智能翻譯平臺可以支持其全球化戰(zhàn)略的龐大翻譯需求。
百度智能文檔翻譯平臺應(yīng)用場景示意
這背后,離不開百度在深度學(xué)習(xí)與機(jī)器翻譯領(lǐng)域的前瞻布局。
追溯至2010年,彼時深度學(xué)習(xí)仍處于發(fā)展初期,百度就已經(jīng)開始布局深度學(xué)習(xí),并于3年后建立全世界首個深度學(xué)習(xí)研究院(IDL)。今年2月,全球市場調(diào)研機(jī)構(gòu)IDC發(fā)布的數(shù)據(jù)顯示,2022年下半年,百度已經(jīng)穩(wěn)居中國深度學(xué)習(xí)平臺市場綜合份額第一。
在機(jī)器翻譯領(lǐng)域,百度十余年來在多語言機(jī)器翻譯、神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯、跨模態(tài)機(jī)器翻譯等方面持續(xù)突破。目前,百度翻譯已形成核心技術(shù)領(lǐng)先、產(chǎn)品矩陣豐富、產(chǎn)業(yè)應(yīng)用廣泛的發(fā)展生態(tài)。
當(dāng)下,大模型和生成式AI時代的到來,正在為機(jī)器翻譯留下新的注解。
與此同時,機(jī)器翻譯的技術(shù)變革帶來的應(yīng)用擴(kuò)展,也為翻譯人員提出了更高的要求。可以看出,前沿技術(shù)的突破是不可逆轉(zhuǎn)的發(fā)展趨勢,作為翻譯工作者如何在當(dāng)下?lián)肀把丶夹g(shù),找到平衡點(diǎn),是置身于行業(yè)中的工作人員與掌握前沿科技的科技大廠都需要關(guān)注的事情。
結(jié)語:機(jī)器翻譯技術(shù)、應(yīng)用大飛躍,為翻譯行業(yè)開辟新賽道
人機(jī)共譯已經(jīng)成為當(dāng)下翻譯行業(yè)從業(yè)者的趨勢,隨著機(jī)器翻譯在翻譯質(zhì)量、系統(tǒng)性能、實用性、規(guī)模化應(yīng)用等方面均取得了較大飛躍,與人工翻譯的契合度越來越高。
與此同時,技術(shù)的發(fā)展與進(jìn)階中,勢必會對各行各業(yè)產(chǎn)生影響,這一背景下,翻譯工作者更快擁抱前沿技術(shù),并將其化身為真正的生產(chǎn)力工具才能在前沿技術(shù)發(fā)展的浪潮中站穩(wěn)腳跟。
隨便看看:
- [數(shù)據(jù)]視頻號苦無“超頭”久矣
- [數(shù)據(jù)]寶存科技企業(yè)級固態(tài)硬盤滿足小微企業(yè)私有云存儲需求
- [數(shù)據(jù)]一個頗具實踐意義的專利失效了
- [數(shù)據(jù)]RTX 4070國行4799元起:比預(yù)期貴一點(diǎn)點(diǎn)#顯卡 #數(shù)
- [數(shù)據(jù)]一繩CableCreation電源線產(chǎn)品推薦,每一款都超好用
- [數(shù)據(jù)]魅族20 “定勝青”配色,你喜歡嗎?#魅族20
- [數(shù)據(jù)]華為Mate 60 Pro+遇到對手!OPPO新旗艦空降并列
- [數(shù)據(jù)]2025年最受歡迎的電動窗簾品牌排名,AI幫您揭曉
- [數(shù)據(jù)]Vivo X Fold 3 Pro相機(jī)樣品在發(fā)布曝光 將配備
- [數(shù)據(jù)]從“人工翻譯”到“人機(jī)共譯”, 生成式AI時代百度如何為翻譯
相關(guān)推薦:
網(wǎng)友評論:
推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件
- 2025年最受歡迎的電動窗簾品牌排名,AI幫您揭曉
- 趣丸千音All Voice Lab來襲!10 倍效
- 拓維海云天智能考試新品重磅發(fā)布,引領(lǐng)考試國產(chǎn)化與數(shù)
- 阿爾西加大研發(fā)力度,加速半導(dǎo)體的“國產(chǎn)化”發(fā)展之路
- 元宇宙中如何修復(fù)數(shù)字文物?
- 探索長尾詞工具,解鎖SEO秘訣!
- 抖音本地新年營銷玩法攻略,助力本地生意開個好頭
- 企云方全面預(yù)算系統(tǒng):財務(wù)智能引領(lǐng)企業(yè)戰(zhàn)略規(guī)劃
- 【智齒科技】AI Agent實現(xiàn)全程自動應(yīng)答,生成
- 簡化大模型訓(xùn)推全流程,天翼云息壤即將重磅升級!