中日科技論文翻譯系統上線 翻譯率達97%

2018年07月30日14:15  來源:人民網-日本頻道
 
中日科技論文翻譯系統發布會現場
中日科技論文翻譯系統發布會現場

人民網北京7月30日電(陳思)近年來,隨著深度學習和神經網絡的廣泛應用,機器翻譯的准確率有了顯著提升。機器翻譯能夠大大提高科研人員獲取外文信息的效率,使外文科技文獻的深度閱讀成為可能。中國科學技術信息研究所27日召開發布研討會,宣布中日兩國共同開發的中日科技論文翻譯系統研制成功,其翻譯率可達97%。

互聯網和大數據時代,科學技術發展速度越來越快,科技論文、專利和科技報告等不同類型的科技文獻數量呈爆發式增長。日本科學技術振興機構、京都大學與中國科學技術信息研究所開展長期合作,聯合中科院自動化所、哈爾濱工業大學及北京交通大學,展開了“面向科技文獻的日漢雙向實用型機器翻譯合作研究”。雙方首先構建了以科技論文為基礎的500多萬條高品質中日雙語語料庫,之后採用了日本科學家研制的神經元網絡翻譯引擎對這些語料數據進行學習。

經評估,利用該翻譯系統進行的中譯日翻譯率達到97%,其中有60%的翻譯精度可達到“信息適當,容易理解”的程度。在2016年12月舉行的以亞洲語言為對象的國際機器翻譯研討會“WAT2016(Workshop on Asian Translation 2016)”上,該翻譯系統在科技信息機器翻譯任務的精度評估中,取得了第一名的成績。

日本科學技術振興機構特別顧問沖村憲樹、著名機器翻譯專家長尾真教授、中國科學技術信息研究所書記趙志耘、所長戴國強、科技部國際合作司調研員姜小平以及參與合作的中日研究人員出席了會議。雙方表示,中日科技論文翻譯系統的問世是中日跨國、跨學科研究的典范,期待能有更多中日科技人員積極利用該系統,同時也將繼續開展研究,為研制出緊跟時代進步、精度更高的翻譯系統而努力。據介紹,2018年5月至9月期間,中日科技論文翻譯系統將面向全球免費開放,未來根據用戶的實際使用效果,預計2019年下半年或2020年開始有償使用。

(責編:陳思、陳建軍)