趣丸科技聯合港中大（深圳）開源首個語音大模型，效果全球領先躋身第一梯隊

作者：網絡時間：2024-10-25 10:57 點擊：次

導讀：10月24日，趣丸科技宣布與香港中文大學（深圳）聯合研發的語音大模型“MaskGCT”正式開源，面向全球用戶開放使用。區別于傳統TTS模型，該模型采用掩碼生成模

10月24日，趣丸科技宣布與香港中文大學（深圳）聯合研發的語音大模型“MaskGCT”正式開源，面向全球用戶開放使用。區別于傳統TTS模型，該模型采用掩碼生成模型與語音表征解耦編碼的創新范式，在聲音克隆、跨語種合成、語音控制等任務中展現出卓越效果。

趣丸科技聯合港中大（深圳）開源首個語音大模型，效果全球領先躋身第一梯隊(圖1)

據介紹，MaskGCT在三個TTS基準數據集上都達到了SOTA效果，超過當前最先進的同類模型，某些指標甚至超過人類水平。顯著特點如下：

1、秒級超逼真的聲音克?。?/strong>提供3秒音頻樣本即可復刻人類、動漫、“耳邊細語”等任意音色，且能完整復刻語調、風格和情感。

2、更精細可控的語音生成：可靈活調整生成語音的長度、語速和情緒，支持通過編輯文本編輯語音，并保持韻律、音色等方面的極度一致。

3、高質量多語種語音數據集：訓練于香港中文大學（深圳）和趣丸科技等機構聯合推出的10萬小時數據集Emilia，是全球最大且最為多樣的高質量多語種語音數據集之一，精通中英日韓法德6種語言的跨語種合成。

據介紹，MaskGCT（Masked Generative Codec Transformer）是一個大規模的零樣本TTS模型，采用非自回歸掩碼生成Transformer，無需文本與語音的對齊監督和音素級持續時間預測。其技術突破性在于采用掩碼生成模型與語音表征解耦編碼的創新范式。實驗表明，MaskGCT在語音質量、相似度和可理解性方面優于當前最先進的TTS模型，并且在模型規模和訓練數據量增加時表現更佳，同時能夠控制生成語音的總時長。MaskGCT已在香港中文大學（深圳）與上海人工智能實驗室聯合開發的開源系統Amphion發布。

該模型研發團隊在語音領域擁有深厚的研究積累和原創性成果。這主要依托趣丸科技十年深耕音頻技術領域和億級高質量語音用戶的服務經驗，以及香港中文大學（深圳）國際一流水平的師資隊伍。早在今年5月份，趣丸科技就與香港中文大學（深圳）宣布共建聯合實驗室，針對人工智能音頻大模型相關的前沿課題進行研究，旨在突破行業難題，促進產學研深度融合，打造技術領先的生成式音頻大模型，填補業界空白。

目前，MaskGCT在短劇出海、數字人、智能助手、有聲讀物、輔助教育等領域擁有豐富的應用場景。為了加快落地應用，在安全合規下，趣丸科技打造了多語種速譯智能視聽平臺“趣丸千音”。一鍵上傳視頻即可快速翻譯成多語種版本，并實現字幕修復與翻譯、語音翻譯、唇音同步等功能。該產品進一步革新視頻翻譯制作流程，大幅降低過往昂貴的人工翻譯成本和冗長的制作周期，成為影視、游戲、短劇等內容出海的理想選擇平臺。

打賞

感謝您的支持，我會繼續努力的!

掃碼打賞，你說多少就多少

打開支付寶掃一掃，即可進行掃碼打賞哦

上一篇：半天妖烤魚再登紅榜，食品安全與節約并重，餐飲界的新標桿！
下一篇：伊康集團攜手團隊參加天津市志愿服務公益市集——“津志集”

隨便看看：

[資訊]“鐵馬冰河”代購氯巴占案免于刑罰，辯護律師：判決體現了司法的

[資訊]假期出游熱，為消費復蘇添火

[資訊]提升糧食生產能力全方位夯實糧食安全根基

[資訊]臺積電拿美國錢“代價驚人”，劉德音黑臉：無法接受

[資訊]“低碳行為令”的價值所在

[資訊]老人被自家狗傳染“Q熱”高燒一周還出現腹痛、黑便等癥狀

[資訊]新一批整改結果來了！多項重大生態環境問題得到有效解決

[資訊]哈爾濱強化房屋裝飾裝修管理事先告知六個嚴禁

[資訊]出境游預訂火熱 “五一”搶單看世界

[資訊]旅客吐槽空姐在廉價航班上推銷商品長達40分鐘，好像到了綠皮火

相關推薦：

[資訊]青海省水井巷集團周報（2023年第41期）

[資訊]青海省水井巷集團周報（2023年第50期）

[資訊]青海省水井巷集團周報（2023年第45期）

網友評論：

推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

欄目分類

國際

國內

資訊

熱評

熱點

專欄

最新文章

搶占合規制高點！臺鈴獲新國標產品認證證書！

直擊2025莫斯科電梯展：看快意電梯如何以專業實力

醉清風酒業易門旗艦店開業：美酒新篇，邀您共啟

池州學院商學院（法學院）與石臺牯牛降映像家園共建大

長城SUPER BURNING超燃新品上市發布會圓

省唄提醒：手把手教你識破冒充“公檢法”詐騙偽裝

奧特曼卡生產商卡游：用光之力量聯結全球玩家情懷

BCM乳鐵蛋白幼兔糧：解鎖萌兔成長密碼，為幼兔健康

多學米以"學術+實踐"雙引擎賦

講真：以科技為基，以普惠為志，點亮終身學習之光

熱門文章

選嬰兒推車的三大步驟，靠譜的避震嬰兒車這樣判斷

唯一乳企！蒙牛集團再獲國家科學技術獎二等獎

上海梅林正式更名為光明肉業以新名稱迎接行業挑戰

南方網通第二十五屆渠道商大會暨樹品5.0發布會圓滿

菲律賓圣保羅大學（土格加勞總校）再傳喜訊！2024

新公司法下要不要減資？這些風險要考慮！

抖音開放平臺助力村超推廣，潑天流量帶來經濟發展新路

南美一姐：秘魯商務考察全攻略，外貿公司和工廠必讀指

減重別只會吃雞胸肉，綠瘦告訴你還有哪些肉類更值得吃

事業家庭雙豐收的幸福人生--莎蔓莉莎員工劉興

趣丸科技聯合港中大（深圳）開源首個語音大模型，效果全球領先躋身第一梯隊

趣丸科技聯合港中大（深圳）開源首個語音大模型，效果全球領先躋身第一梯隊