阿里云開源智能體WebSailor登頂BrowseComp評測榜單

IP屬地中國·北京 編輯：楊凌霄三言科技Pro 時間：2025-07-08 12:12:12

今日阿里云宣布，通義實驗室正式開源網絡智能體WebSailor，該智能體憑借強大的推理與檢索能力，在OpenAI發布的高難度智能體評測集BrowseComp上位列開源榜單首位。目前，其構建方案及部分數據集已在GitHub開源。
WebSailor專為復雜場景設計，能高效處理模糊問題，通過多步推理和交叉驗證從海量信息中精準檢索答案。通義實驗室采用創新的post-training方法，顯著提升了模型在網頁推理任務中的表現。在BrowseComp評測中，WebSailor-32B和WebSailor-72B版本不僅領先于DeepSeek R1、Grok-3等開源模型，甚至超越部分閉源系統，僅次于OpenAI DeepResearch。
此外，WebSailor在普通任務數據集SimpleQA上也展現出優異性能，驗證了其泛化能力。阿里云表示，該智能體的通用工作流及“高難度任務合成+高效RL優化”策略，可為開源社區解決復雜推理、學術發現等挑戰提供借鑒。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

從詩中“配角”到科研“明星”，浮萍正在顛覆未來農業

大眾中國前CEO評小米汽車！

全國首發！重慶發布L3級自動駕駛機動車專用正式號牌！

無人機、機器人沒信號也能通信，科學家探索全新量子糾纏技術框架

人工智能新戰場，在10月后出現了

羅永浩：網速問題已解決，新微信會屏蔽所有媒體人

全站最新

從詩中“配角”到科研“明星”，浮萍正在顛覆未來農業

大眾中國前CEO評小米汽車！

全國首發！重慶發布L3級自動駕駛機動車專用正式號牌！

無人機、機器人沒信號也能通信，科學家探索全新量子糾纏技術框架

熱門推薦

從詩中“配角”到科研“明星”，浮萍正在顛覆未來農業

大眾中國前CEO評小米汽車！

全國首發！重慶發布L3級自動駕駛機動車專用正式號牌！

無人機、機器人沒信號也能通信，科學家探索全新量子糾纏技術框架

芯片，重磅突發！全球首款！

人工智能新戰場，在10月后出現了

羅永浩：網速問題已解決，新微信會屏蔽所有媒體人

OpenAI、xAI打破硅谷鐵律，AI人才年薪破億成常態

AI教父Hinton首爆十年前拍賣：我早已內定谷歌必贏！

AI交易暫時企穩，圣誕行情值得期待否？

世貿組織預測：人工智能有望推動全球貿易增長近40%

小米17手機相機體驗問題修復，此前出現輸出綠色照片情況

谷歌DeepMind：AGI不必是巨型模型，拼湊型AI群或率先涌現，管理大規模Agent迫在眉睫

東風日產天籟?鴻蒙座艙上市首月訂單破萬

雷軍押注，年入超5億，中年男性養不起自己的“泡泡瑪特”