3 月 9 日消息,國家超算互聯網平臺昨日晚宣布本周上線阿里巴巴開源推理模型 QwQ-32B API 接口服務,用戶可獲得免費 100 萬 Tokens。

QwQ-32B 是阿里 Qwen 團隊最新發布的推理模型,基于 Qwen2.5-32B + 強化學習構建。據官方公示的基準評測結果,在測試數學能力的 AIME24 評測集上,以及評估代碼能力的 LiveCodeBench 中,QwQ-32B 表現與 DeepSeek-R1 相當,勝于 o1-mini 及相同尺寸的 R1 蒸餾模型。
據介紹,超算互聯網第一時間完成 QwQ-32B 全面適配,包括基于 vLLM、PyTorch 的推理適配,平臺同步上線 QwQ-32B 模型鏡像、模型文件,用戶無需下載本地,可一鍵啟動 Notebook 功能,在平臺開發 QwQ-32B 模型,或引入專有數據進一步私有化部署。
目前,超算互聯網除提供 QwQ-32B 模型 API 接口服務外,近期還上線有 DeepSeek-R1 全家桶、最高 671B 滿血版的 API 部署與 AI Web 應用服務。附國家超算互聯網平臺 QwQ-32B API 調用服務步驟如下:
用戶在超算互聯網商城首頁中搜索 QwQ-32B,完成后,點擊“去使用”。
進入 API 接口信息頁面:點擊“去使用”后會進入 API 接口信息頁面。
按需選擇訪問形式,有三種訪問形式可選:使用 Postman、Apifox 等 http 工具訪問;使用 python 代碼訪問;以及在終端頁面直接訪問。
目前超算互聯網已連接國內 14 個省的 20 多家超算和智算中心。目前平臺上已有各類算力商品超 6500 款,其中 AI 模型服務近 240 款,既有 DeepSeek、Qwen 等國內開源模型,也有 Llama、Stable Diffusion、Gemma 等國外 AI 開源模型。





京公網安備 11011402013531號