語言橋集團自2000年成立以來,其技術革新之路見證了翻譯行業的巨大變遷。從最初引入計算機輔助翻譯(CAT)工具,到自主研發機器翻譯系統(MT),再到擁抱大語言模型(LLM)的新時代,每一步都凝聚著企業的智慧與勇氣。
故事始于2017年的一個冬日,語言橋集團董事長朱憲超赴沈陽拜訪了東北大學的朱靖波教授,同時也是小牛翻譯的創始人。兩位同姓朱的同年人因緣際會,共謀翻譯技術的未來。次年春天,他們在成都成功舉辦了機器翻譯論壇,匯聚了來自兩岸三地的眾多自然語言處理領域的專家學者,這一盛況預示著機器翻譯春天的到來。
2017年,Google Brain團隊發表的《Attention Is All You Need》論文,為自然語言處理領域帶來了革命性的變化。Transformer模型的提出,摒棄了傳統的循環神經網絡(RNN)和卷積神經網絡(CNN),僅憑注意力機制便取得了卓越成效。這一創新不僅奠定了后續BERT、GPT等大模型的基礎,也推動了計算機視覺、語音等多領域的進步。
語言橋早期便敏銳地察覺到了翻譯技術的重要性。從電子詞典到CAT系統的廣泛應用,再到自研LanCAT平臺的誕生,每一步都體現了企業對技術創新的執著追求。2015年,面對高昂的Trados軟件費用和復雜的操作,語言橋決定自主開發CAT系統,經過兩年多的努力,LanCAT于2017年底在公司內部全面部署使用。
與此同時,機器翻譯技術也在悄然進步。從基于規則和統計的機器翻譯,到神經網絡機器翻譯(NMT)的興起,翻譯質量實現了質的飛躍。2018年成都會議后,語言橋加大了技術投入,不僅擴大了技術團隊規模,還與電子科技大學、西湖大學等科研機構展開了深入合作。2021年底,語言橋自主研發的LanMT系統問世,并在WMT國際機器翻譯大賽中取得了優異成績。
LanMT的成功,離不開語言橋豐富的語料積累和專業的翻譯審校團隊。技術團隊與審校團隊緊密合作,形成了機器與專家協作的閉環,實現了人機交互的及時反饋和技術的快速優化。萊博智2023年度的《機器翻譯報告》也指出,主流MT引擎之間的差距逐漸縮小,預示著MT技術的成熟與穩定。
然而,NMT的發展并未止步于此。2022年,大語言模型的興起,特別是ChatGPT的推出,再次刷新了人們對AI的認知。ChatGPT以其強大的語言生成能力和廣泛的知識儲備,迅速贏得了全球用戶的喜愛。語言橋也緊跟時代步伐,將AI系統與專家系統相結合,提出了“讓AI系統更智能,讓專家系統更可靠”的理念。
在AI系統的加持下,語言橋不斷優化工作流程,提出了MT+PE(機器翻譯+人工審校)的模式,并逐步向AI系統+專家系統的模式轉型。AI系統包括CAT、MT、OCR、LLMs等工具和平臺,而專家系統則根據不同領域、語種和背景進行分類。兩者相互依存、協同工作,共同構成了語言橋的核心競爭力。
面對外界對機器翻譯的質疑,朱憲超董事長總是耐心解釋語言的多樣性和場景的復雜性。他認為,翻譯工作依然需要人類的參與和把關,人機協同將長期存在。同時,他也坦言,大模型的興起對翻譯行業帶來了前所未有的挑戰和機遇。
從CAT到NMT,再到LLM,技術的每一次進步都在重新定義人機工作的內容和邊界。語言橋作為翻譯行業的佼佼者,始終站在技術的前沿,不斷探索和實踐。他們用“AI系統+專家系統”的理念,為翻譯行業探索了一條可持續發展的道路,也為其他企業提供了寶貴的經驗和啟示。