科技日報訊 (記者葛進)中國科學技術信息研究所27日召開發布會宣布,由該所與日本科學技術振興機構、京都大學共同開發的中日科技論文機器翻譯系統研制成功。
近年來,隨著人們對機器翻譯的期待不斷高漲,研制反應更快、精度更高的翻譯系統顯得越來越迫切。為此,日本科學技術振興機構、京都大學與中國科學技術信息研究所開展長期合作,首先構建了以科技論文為基礎的400多萬條高品質中日雙語數據庫,之后採用了日本科學家研制的神經元網絡翻譯引擎對這些數據庫進行學習。這種翻譯引擎的特點是,無論輸入的句子多長,都能高效進行處理,特別是可以大幅度提高長句子的翻譯精度。
這樣,通過大規模、高品質的中日雙語數據庫與最尖端的神經元網絡翻譯引擎相結合,中日雙方構建了全球性能最高的中日日中科技論文翻譯系統。利用該翻譯系統進行的中譯日翻譯水准,經評估翻譯率達到97%。而且,有60%的內容的翻譯精度可達到“信息適當,容易理解”的程度。
在2016年12月舉行的以亞洲語言為對象的國際機器翻譯研討會“WAT2016(Workshop on Asian Translation 2016)”上,該翻譯系統在科技信息機器翻譯任務的精度評估中,取得了第一名的成績。
日本科學技術振興機構代表沖村憲樹、京都大學代表長尾真、中國科學技術信息研究所代表趙志耘以及中日研究人員和中國科技部官員參加了此次發布會。雙方表示,期望該系統在未來發揮真正作用,為中日科研人員的交流提供方便,同時也將繼續開展研究,為研制出精度更高的翻譯系統而努力。