網(wǎng)站地圖 - 關于我們
您的當前位置: 首頁 > 科技 > 業(yè)內(nèi) 正文

理光開發(fā)出高性能日語大語言模型

作者:網(wǎng)絡 時間:2024-06-05 06:19 點擊:
導讀:

  新華社東京6月4日電(記者錢錚)日本理光公司日前表示,該公司利用和日本理化學研究所共同研發(fā)得到的指令數(shù)據(jù)訓練理光的日語大語言模型,提高了模型的指令遵循性能。

  理光公司3日發(fā)布新聞公報說,他們用10329份指令數(shù)據(jù)對公司研發(fā)的130億參數(shù)日語大語言模型進行了指令調(diào)優(yōu)。與調(diào)優(yōu)前相比,大語言模型的指令遵循性能得分從1.19分大幅提高至3.02分。

  指令調(diào)優(yōu)是訓練大語言模型的一個過程,主要為了縮小模型的下一個標記預測目標與用戶期望的模型遵循人類指令的目標之間差距。

  理光公司說,隨著老齡化和隨之而來的勞動人口減少,許多企業(yè)寄希望于利用人工智能來提高生產(chǎn)效率,實現(xiàn)高附加值的勞動方法。而要將人工智能應用于實際業(yè)務,需要讓大語言模型追加學習包括企業(yè)所處行業(yè)、所經(jīng)營業(yè)務、以及企業(yè)固有用語等在內(nèi)的大量數(shù)據(jù)。

  相比英語國家圍繞大語言模型研發(fā)的競爭,日語大語言模型的研發(fā)相對滯后。這主要是因為日語的語法和表達與英語完全不同,以英語為基礎的模型難以充分發(fā)揮功能,而研發(fā)適合日語的模型首先必須花時間研究日語的特征。

  大語言模型的研發(fā)還需要大量數(shù)據(jù),而日語的數(shù)據(jù)遠少于英語,品質(zhì)和多樣性方面也存在問題,日語數(shù)據(jù)的收集和完善需要大量時間和成本。大語言模型研發(fā)還需要很高的算力,而日本超算和云等計算資源原本就不足,能運用這些計算資源的技術和人才也不足。

打賞

取消

感謝您的支持,我會繼續(xù)努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

相關推薦:

網(wǎng)友評論:

推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

Copyright ? 2021 早報網(wǎng) 版權所有
蘇ICP備2024138443號

蘇公網(wǎng)安備32130202081338號

本網(wǎng)站所刊載信息,不代表早報網(wǎng)觀點。如您發(fā)現(xiàn)內(nèi)容涉嫌侵權違法立即與我們聯(lián)系客服 106291126@qq.com 對其相關內(nèi)容進行刪除。
早報網(wǎng)登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內(nèi)容僅供參考,不構成投資建議。投資者據(jù)此操作,風險自擔。
《早報網(wǎng)》官方網(wǎng)站:www.m.shengcaiquan.cn互聯(lián)網(wǎng)違法和不良信息舉報中心
Top 主站蜘蛛池模板: 琼海市| 定西市| 伽师县| 营口市| 平谷区| 北京市| 公主岭市| 田阳县| 嵩明县| 开原市| 伊金霍洛旗| 通渭县| 溧阳市| 土默特右旗| 抚顺市| 黑山县| 玉田县| 盘锦市| 孟村| 铜梁县| 贵溪市| 池州市| 宝清县| 青海省| 宁陵县| 鄂托克旗| 杨浦区| 策勒县| 绥中县| 建湖县| 武鸣县| 彭泽县| 石渠县| 呼伦贝尔市| 永登县| 景谷| 朝阳县| 德清县| 巴彦县| 伊川县| 杭州市|