喜馬拉雅音頻大模型通過備案

IP屬地中國·北京 編輯：王婷北京日報 時間：2024-09-21 14:35:38

記者9月20日從喜馬拉雅獲悉，在近日上海網信辦發布的最新一批上海市生成式大模型備案通過名單中，喜馬拉雅音頻大模型與米哈游、閱文集團的筑夢島等文本大模型共同通過了備案，成為全國首個通過備案的音頻生成類大模型。
據悉，喜馬拉雅音頻大模型是全球首個第四代多情感演繹、超自然表達的音頻生成大模型。
該模型是珠峰AI團隊基于自研文本音頻聯合建模的LLM框架，在同一空間向量表征下實現音頻與文本的聯合建模訓練。通過訓練可實現15秒音色克隆能力和聲音轉換能力；超擬人、多情感、對齊人類偏好的語音生成；高可控風格和副語言能力等。
研發團隊對訓練好的模型進行評估發現，在長音頻內容如有聲小說的場景下，該音頻大模型在角色演繹風格的可控性、音素表現的穩定性、語流韻律停頓等的自然度上顯著高于國內外第三代音頻生成模型。
據悉，喜馬拉雅音頻大模型踐行“產模結合”的范式，通過模型結合產業形成業務、數據、算法的正反饋循環。其在AIGC有聲書、Chat對話式交互等業務場景上廣泛使用，諸如最近爆火的有聲書我的阿勒泰就是由音頻大模型生成。珠峰AI表示，音頻大模型能力已經在珠峰AI官網上可以直接體驗使用，用戶可以直接創作自己的音頻內容。
客戶端
記者：趙語涵

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

80多年前，他們在重慶為全國戰時科研機構養小白鼠

全國首個高海拔巖洞式算力艙智算中心——雅礱江兩河口算電融合示范項目投運

支付寶FluidMarkdown鴻蒙版開源，專為AI流式交互設計

民聲現場·市民講述：“無貨源”模式做跨境電商，竟是騙局！

4.98萬就能買機器人通用基座？一機三態，多場景驗證，配VLA大腦

煥新補貼成效顯現，11月江蘇新能源汽車零售額同比增長26.2%

全站最新

80多年前，他們在重慶為全國戰時科研機構養小白鼠

全國首個高海拔巖洞式算力艙智算中心——雅礱江兩河口算電融合示范項目投運

支付寶FluidMarkdown鴻蒙版開源，專為AI流式交互設計

民聲現場·市民講述：“無貨源”模式做跨境電商，竟是騙局！

熱門推薦

“上參下”腳步逐漸加快，多地農信改革邁出實質性一步

“上參下”腳步逐漸加快，多地農信改革邁出實質性一步

李禮輝：必須加快制度創新，確定金融智能體的法律地位

珠海國資五年輸血45億未果，傅氏姐弟接盤“保殼”，*ST寶鷹5800萬押寶子公司能否續命？

百融云創發布RaaS戰略及“結果云”平臺定義AI硅基智能新范式

聯動科技：新產品QT-9800SoC測試系統已完成實驗室驗證用于測試系統級芯片（SoC）

80多年前，他們在重慶為全國戰時科研機構養小白鼠

優必選與天鵝到家簽署戰略合作協議

中科曙光與商湯科技、大曉機器人合作簽約

全國首個高海拔巖洞式算力艙智算中心——雅礱江兩河口算電融合示范項目投運

支付寶FluidMarkdown鴻蒙版開源，專為AI流式交互設計

民聲現場·市民講述：“無貨源”模式做跨境電商，竟是騙局！

4.98萬就能買機器人通用基座？一機三態，多場景驗證，配VLA大腦

煥新補貼成效顯現，11月江蘇新能源汽車零售額同比增長26.2%

高通雙架構戰略曝光：Oryon管當下，RISC-V賭未來