阿里通義千問開源新一代音頻語言模型支持語音聊天且內容精準度更高

IP屬地中國·北京 編輯：鄭佳太平洋科技 時間：2024-08-13 21:02:39

近日，阿里巴巴旗下通義千問團隊宣布正式開源Qwen2-Audio系列的兩個模型——Qwen2-Audio-7B和Qwen2-Audio-7B-Instruct。Qwen2-Audio系列模型作為大規模音頻語言模型，具備接受多種音頻信號輸入的能力，并能根據語音指令進行音頻分析或直接生成文本響應。
Qwen2-Audio提供兩種交互模式。一是語音聊天模式，用戶可無需文本輸入，直接通過語音與模型進行互動;二是音頻分析模式，用戶可結合音頻和文本指令對音頻內容進行分析，并且該模型支持超過8種語言和方言，包括中文、英語、法語、意大利語、西班牙語、德語、日語和粵語，滿足不同用戶的需求。
Qwen2-Audio與上一代模型Qwen-Audio相比，Qwen2-Audio在聲音理解能力和指令跟隨能力上均實現了顯著提升，通義團隊還發布了一套全新的音頻理解模型測評基準，相關論文已被國際頂級會議ACL 2024收錄。
該模型具有高性能、易于集成和可微調的特點，代碼已集成到Hugging Face的transformers庫，方便開發者快速上手和使用。
在一系列基準數據集的測試中，Qwen2-Audio系列模型的表現超越了之前的最佳模型，展現了其在音頻處理領域的領先地位。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

給AI一雙眼睛：XR眼鏡正在重塑下一代智能終端

摩爾線程技術路線圖全面公開！刷新國產GPU推理天花板，新架構能效飆10倍

全站最新

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

熱門推薦

上饒農商行被罰240萬，上饒銀行被罰170萬

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

雷軍轉發！小米汽車又獲獎再引發輿論安全追問

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

降息，突發！集體拉升，近8萬人爆倉！

給AI一雙眼睛：XR眼鏡正在重塑下一代智能終端

摩爾線程技術路線圖全面公開！刷新國產GPU推理天花板，新架構能效飆10倍

中科大造出首個紫外光譜成像芯片，成本有望直降99%

將RNA的自毀密碼寫入塑料：科學家實現高分子材料的可編程降解

摩爾線程重磅發布：新一代GPU架構“花港”能效提升10倍，系列芯片明年量產上市，推出AI算力筆記本

長安汽車獲得首塊L3級自動駕駛專用正式號牌

供應鏈金融助力發展！2025大宗商品國際化發展大會平行活動舉行

中國網絡空間安全協會盧衛：AI治理應分類，嚴管高風險場景

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

首頁

新科技

新金融

新零售

智能車

房地產

科技探索

人物資訊

網絡游戲

人工智能

阿里通義千問開源新一代音頻語言模型支持語音聊天且內容精準度更高

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

阿里通義千問開源新一代音頻語言模型 支持語音聊天且內容精準度更高

同類資訊

阿里通義千問開源新一代音頻語言模型支持語音聊天且內容精準度更高