騰訊優圖實驗室 投稿
量子位 | 公眾號 QbitAI
智能體(Agent)正成為大模型落地的關鍵載體。無論是研究探索還是實際應用,高效、易用、可復現的智能體框架,都是推動智能體生態發展的基礎設施。
然而,研究者和開發者卻常常遇到一些難題:例如上手門檻高、依賴環境復雜、實驗難以復現,以及動輒需要訓練模型或者充值海外昂貴的閉源模型API才能取得可靠的效果表現。
為此,騰訊優圖實驗室正式開源Youtu-agent——一個簡單而強大的智能體框架,兼顧極簡設計與高性能表現,既能服務科研基線需求,也能支撐實際應用構建,最重要的是不需要訓練模型、不依賴閉源API,就能取得極佳的效果表現。
在多個挑戰性基準上,Youtu-agent已展現出領先的性能:
WebWalkerQA:基于DeepSeek-V3.1達到71.47%準確率,刷新開源效果SOTA;
GAIA(文本子集):基于DeepSeek-V3 Pass@1達到72.8%,不用充值Claude/GPT等閉源模型,驗證了強大的研究和應用潛力。
這意味著,Youtu-agent在完全開源可復現的條件下,已經接近甚至超越部分依賴付費工具的智能體框架。
開箱即用
總體來看,Youtu-agent具有以下核心亮點
1、開源友好&成本敏感
完全基于開源生態,不依賴封閉模型,適配可訪問、低成本的部署環境。
2、靈活架構
構建于openai-agents之上,兼容DeepSeek、gpt-oss等多類模型API與工具集。
3、自動智能體生成
基于YAML配置和“元智能體”對話機制,用戶只需描述需求,即可一鍵生成并運行智能體配置。
4、簡潔高效
模塊化+異步化設計,支持streaming、tracing與agent-loop,高效調試與擴展。
更關鍵的是Youtu-agent 并非實驗室里的“紙上框架”,而是面向真實場景的即用型智能體工具。
研究團隊梳理了四個典型案例,覆蓋文件管理、數據分析、學術研究與廣域綜述,展示了框架的靈活性與實用性。
案例1:本地文件管理
在助教批改作業的場景中,用戶只需將學生提交的文件放入指定文件夾。Youtu-agent啟動后會依次掃描所有文件,首先判斷格式是否為PDF。
如果是PDF,則根據規則自動重命名為“學號-姓名”的規范格式;如果不是PDF,則將其歸檔到獨立的文件夾。整個過程無需人工干預,從文件識別到命名再到分類歸檔,一氣呵成。
案例2:數據分析
當面對Kaggle數據集中的cat_breeds_clean.csv文件時,用戶只需給出路徑。Youtu-agent讀取CSV內容,經過數據清洗和統計分析后,會自動生成結構化的結論與趨勢,并轉化為一份直觀的 HTML 報告。
這個過程中,原始數據被逐步轉化為高價值的信息:從表格讀取、到統計提取、再到結果可視化,形成完整的流水線。
案例3:論文分析
在科研工作中,研究者只需輸入一篇PDF論文。Youtu-agent 首先解析文檔內容,抽取核心部分;隨后調用搜索工具,在外部檢索與其相關的研究工作;最后將論文解讀與外部成果整合,生成一份Markdown報告。
整個過程就像一個“論文助理”:先讀懂論文,再去查找對照,最后寫出一份條理清晰的研究筆記。
案例4:Wide Research
當用戶輸入一個廣域主題時,Youtu-agent便進入復合模式。它先調用搜索工具,收集大量分散的信息;再使用文檔處理工具進行整理;最后由智能體進行分析與總結,生成一份結構化的Markdown綜述。
這個過程相當于把“調研”自動化:從需求提出,到海量資料收集,再到報告成型,整個鏈條由多個子智能體協同完成。
設計原則:DITA
Youtu-agent的研究員提出了DITA原則,總結智能體設計的四個關鍵維度:
Demand(需求):明確任務目標,來源于系統提示詞中的requirements或用戶輸入的intention。
I/O(輸入輸出):定義任務的輸入形式(如CSV、PDF、str)與輸出形式(如HTML報告、Markdown)。
Tools(工具):根據任務選擇或生成合適的工具,例如搜索工具、文件處理工具。
Agent Pattern(范式):決定智能體的交互模式,例如single agent、plan-and-execute、compound。
自動化Agent生成
除了DITA框架之外,Youtu-agent還特別強調了一個核心亮點:自動化Agent生成。
在傳統方式中,用戶往往需要自己手動編寫prompt、配置工具和參數,這不僅對初學者來說存在較高的使用門檻,而且即使是有經驗的用戶,也要投入大量的時間成本。Youtu-agent的解決思路是將這一過程進行標準化與自動化。
具體來說,它采用統一的YAML配置格式,將Agent的輸入輸出、工具調用和交互范式用結構化的方式加以描述;同時引入了一個“meta-agent”,用戶只需提出任務需求,系統就會通過與用戶的交互澄清意圖,并自動生成完整的配置文件。生成的配置可以直接加載并運行,從而實現一鍵測試與使用。
在使用體驗上,用戶只需先運行python s/gen_simple_agent.py,meta-agent會根據需求生成相應的配置;隨后再運行 python s/cli_chat.py —stream —config generated/xxx,就能立即啟動并測試生成的 Agent。這一機制大幅度降低了 Agent 的定制難度,讓初學者可以快速上手,同時也幫助高階用戶節省了繁瑣的配置和調試時間。
(交互式對話,meta-agent 會澄清需求并輸出配置)or, `make sync`cp.env.example .env# config necessary API keys...source./.venv/bin/activate
第二步:跑一個最簡單的智能體
Youtu-agent內置了配置模板,只要寫一個YAML文件,就能定義你的智能體行為。項目中提供了一個搭載搜索工具的基礎agent模板configs/agents/default.yaml,你可以運行下面的代碼一鍵體驗:
python s/cli_chat.py--stream--configdefault




京公網安備 11011402013531號