近期,DeepSeek 旋風席卷全球,其獨有的深度思考+聯(lián)網模式讓用戶紛紛驚嘆好用,如果你想脫離與 AI 的文字互動,與 DeepSeek 進行更具真實感的語音對話,聲網的對話式 AI 引擎讓你15分鐘內就能做到。
今天,聲網對話式 AI 引擎 Beta 版也正式上線,支持開發(fā)者在 Console 后臺自行開通服務接入 API,并在 Playground 中實際調參、測試并生成代碼,僅需2行代碼,15分鐘即可部署基于大模型的對話式 AI Agent。
聲網對話式 AI 引擎官網也已同步上線,開發(fā)者在了解產品功能的同時,也可通過官網申請體驗最新的 Demo 應用。

5大能力讓你的大模型能說會道
1、AI語音秒回: AI 秒回你的提問,語音對話延遲低至650ms。
2、對話人聲鎖定: 屏蔽95%環(huán)境人聲、噪聲干擾,精準識別對話人聲。
3、智能打斷: 模擬真人對話節(jié)奏,隨時打斷與 AI 的對話,響應低至340ms。
4、全模型適配:實現(xiàn) DeepSeek、ChatGPT等全模型適配,更有音視頻 SDK 支持30000+終端機型適配,解決多設備兼容性的后顧之憂。
5、不懼弱網:地鐵、地下車庫等弱網環(huán)境下,人與 AI 也能流暢對話。
聲網對話式 AI 引擎 將為開發(fā)者帶來極致的對話體驗、極簡的開發(fā)部署,即使像 DeepSeek 這樣的文本大模型也能快速轉變?yōu)閷υ捠蕉嗄B(tài)大模型,具備能說會道的能力。同時,對話式 AI引擎同樣支持基于阿里云、騰訊云的穩(wěn)定滿血版 DeepSeek ,不用擔心出現(xiàn)“服務器繁忙,請稍后再試”。

如何快速部署對話式 AI 引擎
開發(fā)者想要快速調用聲網對話式 AI 引擎 RESTful API 實現(xiàn)與 AI 語音互動,根據以下流程就可通過2行代碼,15分鐘快速實現(xiàn)從打開 Console 后臺到說『Hello Agent』,大幅降低開發(fā)門檻。
前提條件:
1、已在聲網 Console 控制臺開通服務,并獲得 App ID、臨時 Token、客戶 ID 和客戶密鑰等信息。
2、已聯(lián)系聲網技術支持為你的項目開通聲網對話式 AI 引擎。
3、你的 App 已實現(xiàn)基本的實時音視頻功能。
4、已獲取大模型提供商的 API key 和回調 URL。
5、已獲取文本轉語音 (TTS) 提供商的 API key。
滿足以上前提條件,就可實現(xiàn)與 Agent 的語音互動。具體流程如下圖所示:

總體來說部署流程分為三個核心步驟:第一步:加入RTC頻道,在你的 App 中調用『 joinChannel 』加入一個 RTC 頻道。
第二步:創(chuàng)建對話式智能體:調用『 創(chuàng)建對話式智能體』創(chuàng)建一個智能體實例,并傳入上一步中使用的頻道名和 Token 讓智能體加入同一個 RTC 頻道。完成該步驟后,聲網會推薦你前往“控制臺 - 對話式 AI 引擎 - Playground”快速體驗與 AI 對話,正確配置各項參數并完成體驗后,點擊右上角的 View code 復制自動生成的服務端 API 調用示例代碼。
第三步:停止對話式智能體:結束對話后,調用『停止對話式智能體』,讓智能體離開 RTC 頻道。
更多具體的詳細部署流程可查看聲網官網的文檔中心。





京公網安備 11011402013531號