今日阿里云宣布,通義實驗室正式開源網絡智能體WebSailor,該智能體憑借強大的推理與檢索能力,在OpenAI發布的高難度智能體評測集BrowseComp上位列開源榜單首位。目前,其構建方案及部分數據集已在GitHub開源。

WebSailor專為復雜場景設計,能高效處理模糊問題,通過多步推理和交叉驗證從海量信息中精準檢索答案。通義實驗室采用創新的post-training方法,顯著提升了模型在網頁推理任務中的表現。在BrowseComp評測中,WebSailor-32B和WebSailor-72B版本不僅領先于DeepSeek R1、Grok-3等開源模型,甚至超越部分閉源系統,僅次于OpenAI DeepResearch。
此外,WebSailor在普通任務數據集SimpleQA上也展現出優異性能,驗證了其泛化能力。阿里云表示,該智能體的通用工作流及“高難度任務合成+高效RL優化”策略,可為開源社區解決復雜推理、學術發現等挑戰提供借鑒。





京公網安備 11011402013531號