網站地圖 - 關于我們
您的當前位置: 首頁 > 科技 > 業內 正文

理光開發出高性能日語大語言模型

作者:網絡 時間:2024-06-05 06:19 點擊:
導讀:

  新華社東京6月4日電(記者錢錚)日本理光公司日前表示,該公司利用和日本理化學研究所共同研發得到的指令數據訓練理光的日語大語言模型,提高了模型的指令遵循性能。

  理光公司3日發布新聞公報說,他們用10329份指令數據對公司研發的130億參數日語大語言模型進行了指令調優。與調優前相比,大語言模型的指令遵循性能得分從1.19分大幅提高至3.02分。

  指令調優是訓練大語言模型的一個過程,主要為了縮小模型的下一個標記預測目標與用戶期望的模型遵循人類指令的目標之間差距。

  理光公司說,隨著老齡化和隨之而來的勞動人口減少,許多企業寄希望于利用人工智能來提高生產效率,實現高附加值的勞動方法。而要將人工智能應用于實際業務,需要讓大語言模型追加學習包括企業所處行業、所經營業務、以及企業固有用語等在內的大量數據。

  相比英語國家圍繞大語言模型研發的競爭,日語大語言模型的研發相對滯后。這主要是因為日語的語法和表達與英語完全不同,以英語為基礎的模型難以充分發揮功能,而研發適合日語的模型首先必須花時間研究日語的特征。

  大語言模型的研發還需要大量數據,而日語的數據遠少于英語,品質和多樣性方面也存在問題,日語數據的收集和完善需要大量時間和成本。大語言模型研發還需要很高的算力,而日本超算和云等計算資源原本就不足,能運用這些計算資源的技術和人才也不足。

打賞

取消

感謝您的支持,我會繼續努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

相關推薦:

網友評論:

推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

欄目分類
Copyright ? 2021 早報網 版權所有
蘇ICP備2024138443號

蘇公網安備32130202081338號

本網站所刊載信息,不代表早報網觀點。如您發現內容涉嫌侵權違法立即與我們聯系客服 106291126@qq.com 對其相關內容進行刪除。
早報網登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。
《早報網》官方網站:www.www.shengcaiquan.cn互聯網違法和不良信息舉報中心
Top 主站蜘蛛池模板: 宁蒗| 中牟县| 灵宝市| 琼海市| 澳门| 上犹县| 新沂市| 西昌市| 明星| 海安县| 北安市| 永济市| 汤原县| 上饶县| 苍山县| 云和县| 台中县| 芷江| 香格里拉县| 鲁山县| 讷河市| 屏东县| 临桂县| 新干县| 赞皇县| 甘谷县| 建瓯市| 陇西县| 义乌市| 华池县| 辽宁省| 平果县| 秦皇岛市| 石城县| 沅陵县| 定陶县| 荣昌县| 阳山县| 贵州省| 新龙县| 景泰县|