9月11日上午,在2025 Inclusion·外灘大會上,2024年圖靈獎得主、“強化學習之父”理查德·薩頓(Richard Sutton)發表主旨演講,他認為,人類數據紅利正逼近極限,人工智能正在進入以持續學習為核心的“經驗時代”,潛力將遠超以往。
薩頓表示,大多數機器學習的目標,是把人類已有的知識轉移到靜態、缺乏自主學習能力的AI 上。“我們逐漸達到人類數據的極限,現有的方法不能生成新的知識,不適合持續學習,而持續學習對智能的效用至關重要。”他認為,我們正進入“經驗時代”,需要一種新的數據源,由智能體與世界直接交互中生成。這正是人類和其他動物的學習方式,是AlphaGo自我博弈下的“第37手”,也是近期AlphaProof在國際數學奧林匹克斬獲銀牌的路徑。
薩頓解釋,“經驗”指的是觀察、行動和獎勵,這三種信號在智能體與世界之間來回傳遞。“知識來自于經驗,可以從經驗中學習。一個智能體的智能程度,取決于它能預測并控制自身輸入信號的程度。經驗是一切智能的核心與基礎。”他同時指出,強化學習帶領我們進入了新的經驗時代,但要釋放全部潛力,還需要兩項目前尚不成熟的技術——持續學習(continual learning)和元學習(meta-learning)技術。
面對外界對AI帶來偏見、失業甚至人類滅絕的擔憂,薩頓認為,這種對人工智能的恐懼被夸大了,目標不同的智能體,可以通過去中心化的協作實現雙贏。“人類最卓越的超能力,就在于比其他任何動物都更擅長協作。人類最偉大的成功在協作本身——經濟、市場與政府都是成功協作的產物。”薩頓表示,人工智能和人類繁榮將來自于去中心化協作,“協作并非總能實現,卻是世間一切美好事物的源泉,我們必須尋求協作、支持協作,并致力將協作制度化。”
他認為,在人類的發展進程中,人工智能的替代將是不可避免的。而人類至少是催化劑,是助產士,更是開啟宇宙第四大時代——“設計時代”的先驅。薩頓將宇宙歷史分為四個時代:粒子時代、恒星時代、復制者時代和設計時代。
“人工智能是宇宙演化的必然下一步,我們應以勇氣、自豪和冒險精神來迎接它。”薩頓表示。





京公網安備 11011402013531號