騰訊開源智能體新框架：不用訓練無需充值，用開源模型實現SOTA Agent

IP屬地中國·北京 編輯：蘇婉清量子位 時間：2025-09-02 20:19:15

騰訊優圖實驗室投稿
量子位 | 公眾號 QbitAI
智能體（Agent）正成為大模型落地的關鍵載體。無論是研究探索還是實際應用，高效、易用、可復現的智能體框架，都是推動智能體生態發展的基礎設施。
然而，研究者和開發者卻常常遇到一些難題：例如上手門檻高、依賴環境復雜、實驗難以復現，以及動輒需要訓練模型或者充值海外昂貴的閉源模型API才能取得可靠的效果表現。
為此，騰訊優圖實驗室正式開源Youtu-agent——一個簡單而強大的智能體框架，兼顧極簡設計與高性能表現，既能服務科研基線需求，也能支撐實際應用構建，最重要的是不需要訓練模型、不依賴閉源API，就能取得極佳的效果表現。
在多個挑戰性基準上，Youtu-agent已展現出領先的性能：

WebWalkerQA：基于DeepSeek-V3.1達到71.47%準確率，刷新開源效果SOTA；

GAIA（文本子集）：基于DeepSeek-V3 Pass@1達到72.8%，不用充值Claude/GPT等閉源模型，驗證了強大的研究和應用潛力。
這意味著，Youtu-agent在完全開源可復現的條件下，已經接近甚至超越部分依賴付費工具的智能體框架。
開箱即用
總體來看，Youtu-agent具有以下核心亮點
1、開源友好&成本敏感
完全基于開源生態，不依賴封閉模型，適配可訪問、低成本的部署環境。
2、靈活架構
構建于openai-agents之上，兼容DeepSeek、gpt-oss等多類模型API與工具集。
3、自動智能體生成
基于YAML配置和“元智能體”對話機制，用戶只需描述需求，即可一鍵生成并運行智能體配置。
4、簡潔高效
模塊化+異步化設計，支持streaming、tracing與agent-loop，高效調試與擴展。
更關鍵的是Youtu-agent 并非實驗室里的“紙上框架”，而是面向真實場景的即用型智能體工具。
研究團隊梳理了四個典型案例，覆蓋文件管理、數據分析、學術研究與廣域綜述，展示了框架的靈活性與實用性。
案例1：本地文件管理
在助教批改作業的場景中，用戶只需將學生提交的文件放入指定文件夾。Youtu-agent啟動后會依次掃描所有文件，首先判斷格式是否為PDF。
如果是PDF，則根據規則自動重命名為“學號-姓名”的規范格式；如果不是PDF，則將其歸檔到獨立的文件夾。整個過程無需人工干預，從文件識別到命名再到分類歸檔，一氣呵成。
案例2：數據分析
當面對Kaggle數據集中的cat_breeds_clean.csv文件時，用戶只需給出路徑。Youtu-agent讀取CSV內容，經過數據清洗和統計分析后，會自動生成結構化的結論與趨勢，并轉化為一份直觀的 HTML 報告。
這個過程中，原始數據被逐步轉化為高價值的信息：從表格讀取、到統計提取、再到結果可視化，形成完整的流水線。
案例3：論文分析
在科研工作中，研究者只需輸入一篇PDF論文。Youtu-agent 首先解析文檔內容，抽取核心部分；隨后調用搜索工具，在外部檢索與其相關的研究工作；最后將論文解讀與外部成果整合，生成一份Markdown報告。
整個過程就像一個“論文助理”：先讀懂論文，再去查找對照，最后寫出一份條理清晰的研究筆記。
案例4：Wide Research
當用戶輸入一個廣域主題時，Youtu-agent便進入復合模式。它先調用搜索工具，收集大量分散的信息；再使用文檔處理工具進行整理；最后由智能體進行分析與總結，生成一份結構化的Markdown綜述。
這個過程相當于把“調研”自動化：從需求提出，到海量資料收集，再到報告成型，整個鏈條由多個子智能體協同完成。
設計原則：DITA
Youtu-agent的研究員提出了DITA原則，總結智能體設計的四個關鍵維度：

Demand（需求）：明確任務目標，來源于系統提示詞中的requirements或用戶輸入的intention。

I/O（輸入輸出）：定義任務的輸入形式（如CSV、PDF、str）與輸出形式（如HTML報告、Markdown）。

Tools（工具）：根據任務選擇或生成合適的工具，例如搜索工具、文件處理工具。

Agent Pattern（范式）：決定智能體的交互模式，例如single agent、plan-and-execute、compound。
自動化Agent生成
除了DITA框架之外，Youtu-agent還特別強調了一個核心亮點：自動化Agent生成。
在傳統方式中，用戶往往需要自己手動編寫prompt、配置工具和參數，這不僅對初學者來說存在較高的使用門檻，而且即使是有經驗的用戶，也要投入大量的時間成本。Youtu-agent的解決思路是將這一過程進行標準化與自動化。
具體來說，它采用統一的YAML配置格式，將Agent的輸入輸出、工具調用和交互范式用結構化的方式加以描述；同時引入了一個“meta-agent”，用戶只需提出任務需求，系統就會通過與用戶的交互澄清意圖，并自動生成完整的配置文件。生成的配置可以直接加載并運行，從而實現一鍵測試與使用。
在使用體驗上，用戶只需先運行python s/gen_simple_agent.py，meta-agent會根據需求生成相應的配置；隨后再運行 python s/cli_chat.py —stream —config generated/xxx，就能立即啟動并測試生成的 Agent。這一機制大幅度降低了 Agent 的定制難度，讓初學者可以快速上手，同時也幫助高階用戶節省了繁瑣的配置和調試時間。
（交互式對話，meta-agent 會澄清需求并輸出配置）
or, `make sync`cp.env.example .env# config necessary API keys...source./.venv/bin/activate
第二步：跑一個最簡單的智能體
Youtu-agent內置了配置模板，只要寫一個YAML文件，就能定義你的智能體行為。項目中提供了一個搭載搜索工具的基礎agent模板configs/agents/default.yaml，你可以運行下面的代碼一鍵體驗：
python s/cli_chat.py--stream--configdefault

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

消息稱某廠新機將全系搭載1216雙揚聲器等，或為榮耀WIN

閃電快訊｜摩爾線程GPU技術路線圖首次公開，展示全棧技術成果

香港創科局張曼莉最新發聲！

「真還傳」后，首次開講科技春晚，羅永浩要祭出什么大招？

字節跳動與手機廠商合作，AI手機的“鴻蒙智行”時代要來了？

消息稱蘋果為iPhone Fold嘗試UFG玻璃，技術難點待解

全站最新

消息稱某廠新機將全系搭載1216雙揚聲器等，或為榮耀WIN

閃電快訊｜摩爾線程GPU技術路線圖首次公開，展示全棧技術成果

香港創科局張曼莉最新發聲！

「真還傳」后，首次開講科技春晚，羅永浩要祭出什么大招？

熱門推薦

消息稱某廠新機將全系搭載1216雙揚聲器等，或為榮耀WIN

Altman直面1.4萬億美元質疑：只要算力還短缺，OpenAI就必須繼續燒錢

閃電快訊｜摩爾線程GPU技術路線圖首次公開，展示全棧技術成果

奧爾特曼腦機公司分拆獨立，要用超聲波“聽”你的想法

谷歌仍是最大威脅！奧爾特曼坦言OpenAI將常態化AI紅色警報

香港創科局張曼莉最新發聲！

「真還傳」后，首次開講科技春晚，羅永浩要祭出什么大招？

字節跳動與手機廠商合作，AI手機的“鴻蒙智行”時代要來了？

消息稱蘋果為iPhone Fold嘗試UFG玻璃，技術難點待解

QCY N20耳機開啟新品預約，129元享大動圈與50dB降噪

摩爾線程發布新一代GPU架構，打造MUSA生態對標英偉達CUDA

預售價9999元，摩爾線程發布AI算力筆記本

國產算力邁入“萬卡”時代：摩爾線程發布新一代GPU架構，中科曙光發布萬卡超集群

全球首臺商用超臨界二氧化碳發電機組成功商運

ESG戰略升級：AI與綠色金融賦能從成本壓力到全球競爭力