日本發布大規模語言模型

2024年05月15日08:22  來源:科技日報
 
原標題:日本發布大規模語言模型

  科技日報訊 (記者李楊)東京工業大學、日本理化學研究所及富士通公司等近日宣布,利用超級計算機“富岳”,他們開發的大規模語言模型“Fugaku-LLM”正式發布。

  “Fugaku-LLM”是首個完全由日本國產技術構建的AI語言模型,其在處理日語及相關文化內容上表現卓越。模型特別擅長基於日語敬語進行自然對話,並展現出在人文社會科學領域的能力。

  面對全球范圍內用於大語言模型計算的GPU短缺現狀,此次研究團隊選擇使用富士通制造的CPU。通過提升“富岳”的計算能力,研究團隊成功實現了完全基於CPU的AI學習。

  “Fugaku-LLM”目前已向全球研究者和技術人員開放,以鼓勵更多的專業人士參與到模型的進一步改進和新的應用研究中,旨在推動更多創新性研究和商業應用的發展。隨著該模型的推廣,預計將加速推動AI技術在各行各業的應用,尤其是在需要深度理解並運用日語的領域。

  普通公眾可在富士通的官網上免費下載並體驗這一技術。這種開放的策略有助於提高公眾對AI技術的理解和接受度,同時也可促進技術的廣泛應用與可持續發展。

(責編:許文金、陳建軍)