阿里巴巴今日震撼發布Qwen3-Coder,這標志著阿里在代碼模型領域邁出了歷史性的一步,其代理能力堪稱業界翹楚。
Qwen3-Coder系列模型規格多樣,其中旗艦版本Qwen3-Coder-480B-A35B-Instruct尤為引人注目。這款模型結合了4800億參數的基礎架構與350億參數的激活MoE機制,天然支持處理256K token的上下文,并通過創新的YaRN技術可擴展至1M token,展現出卓越的代碼生成與Agent能力。在Agentic Coding、Agentic Browser-Use及Agentic Tool-Use等多個維度上,Qwen3-Coder-480B-A35B-Instruct均取得了開源模型的頂尖成績,與Claude Sonnet4比肩而立。
據阿里官方介紹,Qwen3-Coder的引入將極大提升編程效率。即便是編程新手,借助這一工具也能在一天內完成資深程序員一周的工作量。更令人驚嘆的是,創建一個品牌官網的全過程僅需5分鐘。
同時,阿里還推出了Qwen Code,一款專為代理式編程設計的命令行工具。Qwen Code基于Gemini Code深度定制,通過優化prompt和工具調用協議,最大限度發揮了Qwen3-Coder在Agentic Coding任務中的潛力。Qwen3-Coder還能與Claude Code、Cline等社區內的優秀編程工具無縫對接,進一步拓寬了其應用場景。
目前,Qwen3-Coder已在阿里云旗下的百煉大模型服務平臺上線,其API采用靈活的階梯計費模式,根據輸入token的數量動態調整價格。在256K至1M的區間內,輸入價格為每百萬token 6美元,輸出價格則為每百萬token 60美元。相比之下,Claude Sonnet 4的輸入輸出價格分別為每百萬token 3美元和15美元,與Qwen3-Coder在128K至256K區間的價格相當。
為了提升Qwen3-Coder的代碼能力,阿里從多個維度進行了全面升級。在數據方面,阿里構建了總計7.5T的龐大數據集,其中代碼占比高達70%,確保模型在保持通用與數學能力的同時,具備出色的編程技能。在上下文處理上,Qwen3-Coder原生支持256K的上下文長度,并可通過YaRN技術擴展至1M,專為倉庫級和動態數據(如Pull Request)優化。阿里還利用Qwen2.5-Coder對低質數據進行清洗與重寫,顯著提升了整體數據質量。
與當前社區普遍關注競賽類代碼生成不同,阿里認為所有代碼任務都適合通過執行驅動的大規模強化學習進行優化。因此,阿里在更豐富的真實代碼任務上擴展了Code RL訓練,并通過自動擴展測試樣例,構造了大量高質量的訓練實例。這不僅顯著提升了代碼執行成功率,還對其他任務產生了積極影響。在Long-Horizon RL階段,模型學會了在真實軟件工程環境中進行多輪交互,包括規劃、執行、接受反饋和再決策。阿里在Qwen3-Coder的后訓練階段執行了Agent RL,鼓勵模型通過多輪交互的方式利用工具解決問題。
在生態集成方面,Qwen3-Coder提供了多元化的使用方案,降低了開發者的接入門檻。自研的Qwen Code工具基于Gemini Code進行優化,通過prompt和工具調用協議的適配,最大化了模型在代理式編程任務上的表現。同時,Qwen3-Coder還支持與Claude Code的集成使用,開發者可通過阿里云百煉平臺申請API密鑰,實現無縫對接。Qwen3-Coder還兼容Cline等主流編程工具,為開發者提供了豐富的選擇。
在正式發布時,Qwen官方還展示了Qwen3-Coder的多個應用案例。例如,讓模型設計一個基于物理的煙囪拆除模擬,按照實際需求進行受控爆炸。還有開發者讓Qwen3-Coder完成了一個3D HTML開發任務,創建一個3D旋轉的立方體展示臺,六個面顯示不同顏色,自動旋轉,并添加了光照效果和陰影等。Qwen3-Coder交付的結果完成度極高,基本實現了所有主要功能,旋轉動效、陰影等處理得恰到好處。





京公網安備 11011402013531號