9月20日下午消息,近日在上海網信辦發布的最新一批上海市生成式大模型備案通過名單中,喜馬拉雅音頻大模型與米哈游、閱文集團的筑夢島等文本大模型共同通過了備案,成為全國首個通過網信辦生成式人工智能服務的音頻生成類大模型。
喜馬拉雅音頻大模型是全球首個第四代多情感演繹、超自然表達的音頻生成大模型。該模型是珠峰AI團隊基于自研文本音頻聯合建模的LLM框架,在同一空間向量表征下實現音頻與文本的聯合建模訓練。這種聯合建模的方法充分賦予了音頻生成任務以強大的語義信息,并充分利用它們之間的內在聯系和互補信息,大幅度提高模型的性能和泛化能力,這也是第四代音頻大模型超越上一代的核心技術突破。






京公網安備 11011402013531號