亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

6小時復刻AI IMO金牌成果,螞蟻多智能體新進展已開源

IP屬地 中國·北京 編輯:沈如風 量子位 時間:2025-08-02 18:15:54

AWorld項目團隊 投稿
量子位 | 公眾號 QbitAI

2025年的IMO,好戲不斷。

7月19日,全世界頂尖大模型在2025年的IMO賽場上幾乎全軍覆沒。時隔1天,OpenAI、DeepMind等頂尖實驗室就在IMO 2025賽場斬獲5/6題,震驚數學圈。

有意思的是,7月23日——兩位來自Harvard和UCLA的學生,用Gemini 2.5 Pro+自研多輪驗證框架,在arXiv扔下一篇論文,首次系統性拆解了「解題+驗證」的IMO解題方法論。48小時后,他們開源了完整代碼。

來自螞蟻的多智能體框架AWorld項目團隊也加入了這場卷王之爭:

7月24日啟動,僅僅6小時,采用AWorld智能體框架,復現并開源了DeepMind的5/6道解題結果,并直接給出了可一鍵運行的多智能體IMO系統。



果然,大家好奇的點還是跟傳統長思維鏈LangChain等框架有什么不一樣。作者給出的回復,核心就是一個詞,自我進化。即,多智能體能夠超越單個智能體,能夠用于復雜問題協同,以及強化學習的獎勵模型等,最終實現AGI。



IMO 2025,把復雜推理模型推向了一種新的高度(盡管還處在實驗室階段,但DeepMind透露會對外)。

不過,能解IMO級別數學題的超級單智能體實屬稀有。AWorld的實驗也首次用工程系統證明:多智能體協同的智力上限,有可能超越其依賴的單個模型。

單模的「不可能三角」:為什么必須上多智能體?

單個裸模型,包括Gemini 2.5 pro,幾乎無法一次推理答對IMO賽題:level 1的第1,第4題在小概率下一次推理能答對(背景:IMO包括六道競賽題目,分為兩天進行,參賽者每天需完成3道題目,因此第一題難度相對較低),但是其余4題,一定需要多智能體協同才能完成,這揭露了一個殘酷現實:IMO級問題=單模的不可達之地。

AWorld的實測數據更扎心:

單模嘗試第3題:連續(xù)10次推理全部失敗。多智能體協同:通過「解題者+驗證者」雙角色對話,第3題在第5輪迭代就生成了完整的解答。“多智能體協同的智力上限,有可能超越其依賴的單個模型”的本質是什么呢?

為此,AWorld團隊嘗試提出了幾種解釋視角:

構建最優(yōu)輸入:從“好問題”到“完美上下文”

多智能體協同的核心優(yōu)勢在于它能動態(tài)地構造出一個遠超初始提問的、高質量的輸入信息。

基本原理(y = f(x)):我們可以將大模型視為一個固定的函數f,其輸出y的質量完全取決于輸入x的質量。

初始輸入的局限:對于如IMO競賽題這類復雜任務,最初的提問(x_0)信息稀疏,缺乏足夠的引導“腳手架”。這使得模型難以在其龐大的能力空間中,僅憑一次嘗試就找到通往正確答案的路徑。

協同的價值:多智能體系統并非提升模型f本身,而是設計了一個“智能流程”:通過生成和整合中間思想(如解題草稿、批判性反饋、改進建議),共同構建出一個信息極其豐富的“超級上下文”。這最終解鎖了模型早已具備、但通過簡單提問難以觸達的深層能力。

實現“元認知”:為系統外掛一個“反思模塊”

元認知,即“關于思考的思考”,是高級智能的核心標志。它包括自我監(jiān)控、自我評估和自我修正的能力。單個LLM本身不具備真正的元認知,但可以通過角色定義(Role-Play)來執(zhí)行元認知功能。

它不解決問題,而是評估解決方案的合理性、尋找邏輯漏洞、提出改進建議,從而避免了單模型容易陷入的思維定式和錯誤。

通過交互降低“信息熵”(Reducing Information Entropy)

一個復雜的IMO問題,其解空間的不確定性(信息熵)非常高。每一次有效的多智能體交互都在為系統提供新的約束,從而降低這種不確定性。

例如,審閱者指出“你的第一步假設A是無證據的”,這個反饋極大地減少了后續(xù)需要探索的可能性,使計算資源能更集中地探索更有希望的路徑,從而顯著提升了求解的效率和準確性。

綜上,多智能體協同的優(yōu)越性源于其智能化的流程,而非個體能力的提升。該流程通過協作分解與迭代修正,能有效解鎖基礎模型的深層潛力,最終涌現出超越個體能力之和的系統級智能。

AWorld的「六小時魔法」:把論文變成可運行系統

面對地獄級難度的IMO,相比模型頂流拿下成績秀肌肉,能夠復現的解題過程可能更加有利于技術的演進,所以我們更希望看到有一些開源的工作。AWorld的復現方式,提供了一些思路:

核心結構:采用了”做題家”和”驗證者”的雙智能體對話機制,兩者均依賴于相同的基礎模型(如Gemini 2.5 pro)來構建。其中,做題家負責生成數學解答,驗證者扮演IMO考官角色進行嚴格驗證,兩者通過多輪對話迭代優(yōu)化解答質量。核心要素:設計了完整的對話循環(huán)機制,包括自動檢測終止條件、最終答案、記錄完整對話歷史,以及基于驗證者反饋的解答重構策略,有效挖掘了基礎模型的潛在能力。身份設定與上下文工程:做題家采用嚴格的數學證明格式要求,驗證者則具備詳細的錯誤分類體系和標準化的驗證流程,這種專業(yè)化的角色分工顯著提升了問題解決的質量和準確性。

目前,AWorld在著名的GAIA Test榜單(即通過增加工具支持、更高效的提示、接入搜索等手段獲得增強能力的新一代大語言模型的基準)上達到了77.08分,在所有署名的智能體中排名第三,在所有開源工作中排名第一。

為多智能體協同而生

作為一個為構建生產級、可擴展多智能體系統而設計的下一代框架,AWorld核心優(yōu)勢是采用事件驅動的群體智能架構,徹底超越了傳統LangChain等框架的局限。

智能體之間通過事件總線進行異步通信與協作,而非簡單的順序調用。這使得復雜的實時交互成為可能。

強大的工具與模型生態(tài)

模型即插即用:通過統一接口,可在30秒內輕松切換OpenAI、Gemini、Claude等任意大語言模型,方便對比測試與成本優(yōu)化。MCP協議支持:將MCP作為核心能力,允許智能體將其他模型或智能體作為工具調用,極大拓展了能力邊界。所有工具均在安全沙箱中執(zhí)行,保障企業(yè)級安全。

生產級的穩(wěn)健性與可觀測性

全鏈路可觀測性:提供覆蓋智能體決策、工具調用全過程的追蹤、指標與日志,讓復雜的系統行為清晰透明,易于調試。精密的上下文與內存管理:支持長短期記憶和復雜編排,確保智能體在執(zhí)行長周期任務時能保持狀態(tài)、不“失憶”。

支持模型持續(xù)進化的學習閉環(huán)

開放訓練接口:AWorld不僅是執(zhí)行框架,更是進化平臺。它提供開放接口,可與主流訓練框架結合,利用智能體在真實任務中產生的交互數據對底層模型進行訓練。實現智能體自我進化:通過“數據-訓練-部署”的閉環(huán),讓智能體在特定領域變得越來越“聰明”,構建真正的專家智能體系統。

如何體驗「IMO級多智能體」?

3步運行(詳見README.md):

一鍵準備環(huán)境

進入項目目錄AWorld/examples/imo,然后直接運行腳本./setup_env.sh。自動創(chuàng)建獨立的Conda環(huán)境并安裝所有必需的依賴。

配置API密鑰

復制模板文件cp.env_template.env,然后編輯新生成的.env文件,填入你自己的大模型API密鑰(LLM_API_KEY)、模型名稱(LLM_MODEL_NAME)和接口地址(LLM_base_URL)。

激活環(huán)境并運行

首先激活環(huán)境,然后執(zhí)行主程序來解決指定的數學問題,例如運行python run.py —q imo4來解決IMO2025第4題。

寫在最后:IMO只是開始

AWorld的復現實驗,拋出了一個激進結論:當前多智能體系統的數學能力,已超越99%人類選手(雖然測試集有限)。

當單模在IMO折戟時,多智能體系統已經證明:AI的智能上限,可能不只在于模型有多大,更在于我們如何組織它們工作。

多智能體協作,可能是一條通往更高群體智能的有效路徑。更震撼的是未來潛力:這套系統正在作為reward model訓練下一代模型——用多智能體生成的「高階推理軌跡」作為訓練數據,相當于讓模型從IMO金牌選手的草稿紙里學習。

下一站,AWorld團隊透露正在測試「多智能體+形式化驗證」組合,目標直指Lean4形式化證明。

IMO 2026,可能將是人類最后一次有機會戰(zhàn)勝AI的數學競賽。

Gemini 2.5 Pro+:
論文地址:
https://arxiv.org/pdf/2507.15855

AWorld:
GitHub:https://github.com/inclusionAI/AWorld

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

日本一区二区在线不卡| 爽好久久久欧美精品| 亚洲国产又黄又爽女人高潮的| 午夜免费一区二区| 久久中文字幕电影| 国产精品国产亚洲精品看不卡15 | 97久久久久久久| 亚洲白虎美女被爆操| 天天久久综合网| 亚洲精品视频在线| 欧美高清性xxxxhdvideosex| 动漫av一区二区三区| 久久久999国产| 岛国片在线免费观看| 欧美日韩国产成人在线91| 任你操这里只有精品| 久久欧美中文字幕| 欧美日韩在线观看一区二区三区| 国产精品久久久久久久免费| 麻豆国产精品va在线观看不卡| 国产免费一区二区三区四区| 欧美日韩久久久一区| 免费看污黄网站| xfplay精品久久| 欧美性大战久久久久| 美女一区二区视频| 91色精品视频在线| av在线亚洲天堂| 欧美激情在线狂野欧美精品| 97久久久久久久| 日韩在线观看免费全| 久久久香蕉视频| 亚洲夜晚福利在线观看| 波多野结衣家庭教师| 精品亚洲一区二区三区四区五区| 欧洲av一区二区三区| 欧美日韩五月天| 美女被艹视频网站| 午夜久久久影院| 中文字幕线观看| 色综合久久综合| 色啦啦av综合| 91国内精品野花午夜精品| 丰满少妇一区二区三区专区| 一本一道久久a久久精品| 中文字幕 日韩 欧美| 色美美综合视频| 中文字幕av一区二区三区人妻少妇| 黑人巨大精品欧美一区二区三区| 免费看污久久久| 国产成人激情av| 欧美极品少妇与黑人| 狠狠躁夜夜躁人人爽天天高潮| 久久影院资源网| 天天操天天操天天操天天| 欧美激情精品久久久久久蜜臀| 在线观看中文字幕网站| 韩国日本不卡在线| 东京干手机福利视频| 99高清视频有精品视频| 三级欧美韩日大片在线看| 精品卡一卡二| 99r国产精品| 乱人伦xxxx国语对白| 洋洋av久久久久久久一区| 欧美一级小视频| 欧美一区二区三区日韩| 免费看特级毛片| 色综久久综合桃花网| 五月婷婷色丁香| 欧亚精品中文字幕| 日韩av不卡在线观看| 亚洲欧美国产精品桃花| 国产精品久久免费看| 中文字幕成人免费视频| 欧美性jizz18性欧美| 大地资源二中文在线影视观看 | 26uuu国产电影一区二区| 毛片av在线播放| 图片区小说区国产精品视频| 中文字幕高清视频| 亚洲欧美精品一区| 中文字幕永久免费视频| 国产精品无码专区在线观看| 日韩精品亚洲专区| 国产美女视频免费| 动漫精品一区二区| 国产不卡在线观看视频| 欧美激情免费看| 日韩激情av在线| 超级碰在线观看| 亚洲成人免费视频| 国产调教在线观看| 97超碰蝌蚪网人人做人人爽 | 日韩视频免费看| 国产黄色片免费观看| 激情小说网站亚洲综合网| 中文字幕一区在线| 人妻丰满熟妇aⅴ无码| 另类色图亚洲色图| 久久国产精品一区二区| 那种视频在线观看| 日韩三级中文字幕| 亚洲一级片免费看| 欧美日韩电影一区二区三区| 国产精品卡一卡二| 亚洲精品视频大全| 欧美激情在线一区| 日韩精彩视频在线观看| 国产特级黄色大片| 日韩精品视频观看| 人人妻人人澡人人爽久久av| 日韩一本精品| 欧美性猛交一区二区三区精品| 中文在线观看免费网站| 国产剧情久久久久久| 久久精品视频一区二区三区| 国产人成视频在线观看| 77777少妇光屁股久久一区| 成人午夜视频免费看| 国产精品一区二区在线免费观看| 久久久久久亚洲精品| 国产suv精品一区二区883| theporn国产精品| 久久成年人免费电影| 国产成人啪免费观看软件| 国产精品秘入口18禁麻豆免会员| 日韩精品久久久久 | 欧美在线a视频| 欧美大片第1页| 成人精品免费视频| 在线观看免费视频黄| 国产97免费视| 亚洲欧美中日韩| 国产男女猛烈无遮挡在线喷水| 欧美一级免费看| 2020国产精品久久精品美国| 91精彩刺激对白露脸偷拍| 国产精品久久久久久av福利| 亚洲欧美日韩精品久久久久| fc2ppv在线播放| 亚洲最大成人网色| 欧美在线免费观看视频| 国产福利第一页| 五月天婷婷激情视频| 欧美激情一区二区三区久久久| 99久久综合精品| 91香蕉视频污在线观看| 鲁丝一区二区三区免费| 日韩一卡二卡三卡| 久久99国内精品| ass精品国模裸体欣赏pics| 亚洲自拍在线观看| 欧美日韩国产综合久久| 午夜精品久久久久久久91蜜桃| av网站在线不卡| 国产suv精品一区二区| 亚洲大片在线观看| 国产乱码久久久久| 黄色www网站| 久久久999国产精品| 中文字幕在线视频一区| 中文字幕第315页| 色婷婷综合网站| 成人黄色在线播放| 欧美日韩免费一区二区三区| 日韩制服丝袜先锋影音| 97人妻天天摸天天爽天天| 欧美成人精品在线播放| 国产精品乱人伦| 一本色道久久综合亚洲| 欧美日韩亚洲自拍| 国产精品高潮视频| 欧美伊人久久大香线蕉综合69| 免费在线看成人av| 美女av免费看| 91网站在线观看免费| 欧美精品福利在线| 高跟丝袜欧美一区| 视频一区视频二区中文| 大吊一区二区三区| 色噜噜狠狠一区二区三区| 久久人人爽亚洲精品天堂| 1024国产精品| 婷婷久久久久久| 人妻少妇无码精品视频区| 色姑娘综合网| 欧美国产日韩一区| 精品久久在线播放| 国产一区二区成人久久免费影院| 久久久久久久久久久久久久免费看 | 高清久久久久久| 91在线视频免费播放| 欧美成人精品一区二区综合免费| 久久一区二区三区av| 在线精品视频视频中文字幕| 亚洲精品视频免费看| 美女视频一区免费观看| www色aa色aawww| 日本日本19xxxⅹhd乱影响| 91网站在线看| 日韩av一区在线| 亚洲影院在线观看| 韩国一区二区三区| 伊人久久综合视频| 又色又爽又黄18网站| 中文字幕一区二区三区有限公司| 欧美影院在线播放| 精品少妇一区二区三区在线播放 | 欧美午夜影院在线视频| 亚洲国产欧美一区二区三区丁香婷 | 亚洲欧美日韩国产精品| 亚洲一级在线观看| 蜜臀久久99精品久久久| 在线免费观看亚洲视频| 在线观看av网页| 视频在线精品一区| 欧美孕妇与黑人孕交| 日韩免费一区二区三区在线播放| 亚洲天堂成人在线观看| 美女网站一区二区| 最新国产中文字幕| 中文字幕成人动漫| 久久无码高潮喷水| 翔田千里亚洲一二三区| 国产在线高清精品| 另类天堂视频在线观看| 日韩一级免费观看| 一区二区三区四区不卡在线| 国产精品一级在线| 国产 日韩 欧美 综合| 男女做暖暖视频| 国产毛片毛片毛片毛片毛片毛片| 久久久噜噜噜www成人网| 欧美日韩一区二区视频在线观看| 国产精品国产三级国产aⅴ浪潮| 中文字幕在线精品| 欧美一区二区三区公司| 亚洲精品成人天堂一二三| 久久电影网站中文字幕| 国产精品无码一区二区桃花视频 | 亚洲日穴在线视频| 91视频国产资源| 久久成人羞羞网站| 欧美熟妇乱码在线一区| 五月天综合在线| 国产aaaaaaaaa| 男人午夜视频在线观看| 成人黄色av片| 亚洲国产一区二区精品视频| 91免费欧美精品| 欧美影院久久久| 欧美老少做受xxxx高潮| 亚洲视频资源在线| 久久久久9999亚洲精品| 国产美女在线观看一区| 精品人妻一区二区三区浪潮在线 | 777精品视频| 久久精品视频99| 国产亚洲欧洲黄色| 在线播放91灌醉迷j高跟美女 | 国模娜娜一区二区三区| 日韩av中文在线观看| 日韩中文字幕综合| 成人精品在线播放| 国产ts人妖调教重口男| 中文在线第一页| 免费在线不卡视频| 日本亚洲欧美在线| 一区二区三区免费高清视频| 免费看黄色的视频| 黄色aaa视频| 五月婷婷综合在线观看| 手机在线看片日韩| 人妻熟女aⅴ一区二区三区汇编| 国产二级一片内射视频播放| bl动漫在线观看| 精品人妻一区二区免费视频| 污视频网址在线观看| 四虎成人在线播放| 亚洲精品综合在线观看| 中文字幕第三区| 手机免费看av片| 无遮挡aaaaa大片免费看| av在线播放天堂| 成人午夜精品久久久久久久蜜臀| 久久久性生活视频| 日本www在线播放| 日本在线观看免费视频| 三级黄色片免费看| www.日本高清| 五月婷婷婷婷婷| 久久精品女人毛片国产| 久久国产乱子伦精品| 99在线小视频| 女人18毛片水真多18精品| 最近中文字幕免费观看| 久久午夜无码鲁丝片| 日本熟妇乱子伦xxxx| 一级全黄少妇性色生活片| 久久一区精品| 99久久夜色精品国产网站| 亚洲同性同志一二三专区| 日本高清无吗v一区| 精品国产一区二区三区久久久蜜月| 亚洲欧美中文日韩v在线观看| 欧美精品成人91久久久久久久| 国产精品国产三级国产专区53 | 国模一区二区三区白浆| 国产精品你懂的| 91黄色免费网站| 亚洲欧洲黄色网| 国产精品美女久久| 亚洲精品中文综合第一页| 黄色av免费在线播放| 手机看片福利视频| 国产偷人爽久久久久久老妇app| 日韩电影在线免费看| 欧美日韩性视频在线| 日韩一级高清毛片| 热re91久久精品国99热蜜臀| 亚洲qvod图片区电影| 日韩av电影在线观看| 日本精品福利视频| 伊人国产在线视频| 国产制服丝袜在线| 国产高潮国产高潮久久久91| 91成人一区二区三区| 国产福利91精品| 亚洲一区二区在线免费看| 日韩欧美亚洲另类制服综合在线| 久久99热这里只有精品国产| 国产精品视频免费一区二区三区 | 激情五月俺来也| 久久久久久久久久久久国产| 天天爱天天干天天操| 最新欧美精品一区二区三区| 精品国产三级a在线观看| 欧美亚洲一级片| 在线视频一区观看| 国产精品一区二区人妻喷水| www.亚洲激情| 97久久超碰国产精品电影| 欧美日韩黄色影视| 69视频在线播放| 强开小嫩苞一区二区三区网站| 双性尿奴穿贞c带憋尿| 精品毛片一区二区三区| 欧美国产日韩在线观看| 亚洲电影在线看| 亚洲综合国产精品| 男人添女人下面免费视频| 日韩 欧美 综合| 不卡一二三区首页| 亚洲第一中文字幕| 51国产成人精品午夜福中文下载 | 国产69精品久久777的优势| 欧美亚洲日本国产| 欧美在线视频网| 日日橹狠狠爱欧美超碰| 欧美成人精品欧美一级| 国产精品亚洲一区二区三区在线| 欧美日韩精品电影| 国产欧美日韩专区发布| 欧美日韩怡红院| 337p粉嫩色噜噜噜大肥臀| 久久精品视频在线看| 国产一级揄自揄精品视频| 久久久久久成人精品| 自拍另类欧美| 老司机福利在线观看| 狠狠色狠狠色综合系列| 91精品国产乱码久久蜜臀| 欧美在线视频播放| 亚洲五码在线观看视频| 国产第一页精品| 国产永久免费视频| 91视视频在线观看入口直接观看www | 国产精品制服诱惑| 日本一区二区三区四区高清视频 | 图片区小说区区亚洲五月| 小早川怜子久久精品中文字幕| 视频一区在线视频| 99精品国产91久久久久久| 日韩午夜小视频| 欧洲中文字幕国产精品| 91免费黄视频| 2019男人天堂| 九一久久久久久| 884aa四虎影成人精品一区| 尤物yw午夜国产精品视频| 99国产超薄肉色丝袜交足的后果| 丰满少妇久久久| 国产一区二区播放| 日日躁夜夜躁白天躁晚上躁91| 亚洲综合一区二区三区| 久久久精品电影| 成人午夜视频免费观看| 天天爱天天做天天爽| 亚洲va国产va欧美va观看| 成人www视频在线观看| 日本黄色动态图| 精品一区二区在线视频| 欧美日韩成人激情| 国产一区二区三区高清| 内射毛片内射国产夫妻| 成人精品电影在线观看| 在线观看欧美www| 日韩欧美视频网站| 国产片在线播放|