![]()
吳恩達(dá)老師最新觀點(diǎn):并行 Agent是擴(kuò)展 AI 的新方向
并行 Agent 正在成為擴(kuò)展 AI 的一個(gè)重要新方向。AI 的能力在過(guò)去依靠更多的訓(xùn)練數(shù)據(jù)、訓(xùn)練階段的計(jì)算量,以及推理階段的計(jì)算量不斷提升。如今,讓多個(gè) Agent 并行運(yùn)行正在成長(zhǎng)為進(jìn)一步擴(kuò)展和提升性能的一種方法
![]()
早期在百度的研究,以及后續(xù) OpenAI 的工作,都證明了 AI 模型的性能會(huì)隨著數(shù)據(jù)量和訓(xùn)練計(jì)算量的增加而穩(wěn)定提升。而在推理階段,如果通過(guò) Agent 工作流,或是在推理模型中引入“思考、反思、迭代”的過(guò)程,性能還會(huì)進(jìn)一步提高。但這類方法通常需要更長(zhǎng)的時(shí)間來(lái)產(chǎn)出結(jié)果。并行 Agent 則提供了一條新的路徑:在不讓用戶等待過(guò)久的情況下提升效果。
推理模型在生成時(shí)是順序進(jìn)行的,因此往往運(yùn)行時(shí)間較長(zhǎng)。同樣,大多數(shù) Agent 工作流在最初的實(shí)現(xiàn)中也是串行的。但隨著 LLM 單 token 價(jià)格的不斷下降——這些技術(shù)逐漸變得更為可行——而產(chǎn)品團(tuán)隊(duì)也希望能更快地為用戶提供結(jié)果,越來(lái)越多的 Agent 工作流開始實(shí)現(xiàn)并行化。
一些例子:
許多研究型 Agent 現(xiàn)在能夠同時(shí)抓取多篇網(wǎng)頁(yè),并并行分析其內(nèi)容,從而更快地生成深度研究報(bào)告
部分代碼類的 Agent 框架允許用戶調(diào)度多個(gè) Agent,同時(shí)在代碼庫(kù)的不同部分開展工作。例如,在 Claude Code 的課程中就展示了如何使用 git worktrees 來(lái)實(shí)現(xiàn)這一點(diǎn)
一種正在快速流行的 Agent 工作流設(shè)計(jì)模式是:讓一個(gè)計(jì)算量龐大的 Agent 花費(fèi)數(shù)分鐘甚至更長(zhǎng)時(shí)間來(lái)完成任務(wù),同時(shí)由另一個(gè) Agent 負(fù)責(zé)向用戶提供簡(jiǎn)短的進(jìn)度更新。進(jìn)一步演化后,這類前端 Agent 還能在保持用戶知情的同時(shí),將用戶的異步反饋傳遞給后臺(tái)的其他 Agent,從而形成更高效的協(xié)作
將復(fù)雜任務(wù)(如構(gòu)建一個(gè)復(fù)雜的軟件應(yīng)用)拆解成更小的子任務(wù),再分配給不同的工程師并行完成,本身對(duì)人類管理者來(lái)說(shuō)就極具挑戰(zhàn),尤其在需要擴(kuò)展到數(shù)以百計(jì)甚至更多工程師時(shí)更為困難。同樣地,如何有效地為并行 Agent 進(jìn)行任務(wù)分解,也是一個(gè)難點(diǎn)。
不過(guò),隨著 LLM 推理成本的不斷下降,使用更多的 token 成為一種可行的選擇,而并行化的方式則使得這種使用不會(huì)顯著增加用戶的等待時(shí)間。
越來(lái)越多關(guān)于并行 Agent 的研究也在涌現(xiàn)。例如:
《CodeMonkeys: Scaling Test-Time Compute for Software Engineering》展示了并行代碼生成如何幫助探索更大的解法空間
Junlin Wang提出的 Mixture-of-Agents 架構(gòu),則是一種出乎意料的簡(jiǎn)潔方式來(lái)組織并行 Agent:讓多個(gè) LLM 獨(dú)立生成答案,再由一個(gè)匯總 LLM 將它們整合為最終結(jié)果。
關(guān)于如何最好地利用并行 Agent,仍有大量研究與工程探索空間。但可以預(yù)見的是,能夠高效并行工作的 Agent 數(shù)量會(huì)非常龐大,就像人類社會(huì)中能夠高效協(xié)同的群體人數(shù)也可以非常之多一樣
source:
https://www.deeplearning.ai/the-batch/issue-316/





京公網(wǎng)安備 11011402013531號(hào)