“強化學習之父” 理查德·薩頓：人類數據紅利逼近極限，AI正進入以持續學習為核心的“經驗時代”

IP屬地中國·北京 編輯：馮璃月證券時報 時間：2025-09-11 13:12:06

9月11日上午，在2025 Inclusion·外灘大會上，2024年圖靈獎得主、“強化學習之父”理查德·薩頓（Richard Sutton）發表主旨演講，他認為，人類數據紅利正逼近極限，人工智能正在進入以持續學習為核心的“經驗時代”，潛力將遠超以往。
薩頓表示，大多數機器學習的目標，是把人類已有的知識轉移到靜態、缺乏自主學習能力的AI 上。“我們逐漸達到人類數據的極限，現有的方法不能生成新的知識，不適合持續學習，而持續學習對智能的效用至關重要。”他認為，我們正進入“經驗時代”，需要一種新的數據源，由智能體與世界直接交互中生成。這正是人類和其他動物的學習方式，是AlphaGo自我博弈下的“第37手”，也是近期AlphaProof在國際數學奧林匹克斬獲銀牌的路徑。
薩頓解釋，“經驗”指的是觀察、行動和獎勵，這三種信號在智能體與世界之間來回傳遞。“知識來自于經驗，可以從經驗中學習。一個智能體的智能程度，取決于它能預測并控制自身輸入信號的程度。經驗是一切智能的核心與基礎。”他同時指出，強化學習帶領我們進入了新的經驗時代，但要釋放全部潛力，還需要兩項目前尚不成熟的技術——持續學習（continual learning）和元學習（meta-learning）技術。
面對外界對AI帶來偏見、失業甚至人類滅絕的擔憂，薩頓認為，這種對人工智能的恐懼被夸大了，目標不同的智能體，可以通過去中心化的協作實現雙贏。“人類最卓越的超能力，就在于比其他任何動物都更擅長協作。人類最偉大的成功在協作本身——經濟、市場與政府都是成功協作的產物。”薩頓表示，人工智能和人類繁榮將來自于去中心化協作，“協作并非總能實現，卻是世間一切美好事物的源泉，我們必須尋求協作、支持協作，并致力將協作制度化。”
他認為，在人類的發展進程中，人工智能的替代將是不可避免的。而人類至少是催化劑，是助產士，更是開啟宇宙第四大時代——“設計時代”的先驅。薩頓將宇宙歷史分為四個時代：粒子時代、恒星時代、復制者時代和設計時代。
“人工智能是宇宙演化的必然下一步，我們應以勇氣、自豪和冒險精神來迎接它。”薩頓表示。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

華為云城市峰會在烏蘭察布召開，當地已吸引67個數據中心項目

火山引擎的「火」，是怎么點起來的

馬斯克：非自動駕駛燃油車終將消亡最終的競爭力是智能化

XREAL 1S發布：3299元起，用一副眼鏡把500英寸巨幕“戴”在身上

歐洲頂尖神經學家：中國為科學家提供“絕佳機遇”

“元寶AI自動回復太像真人”引質疑騰訊為其發聲

全站最新

華為云城市峰會在烏蘭察布召開，當地已吸引67個數據中心項目

火山引擎的「火」，是怎么點起來的

馬斯克：非自動駕駛燃油車終將消亡最終的競爭力是智能化

XREAL 1S發布：3299元起，用一副眼鏡把500英寸巨幕“戴”在身上

熱門推薦

寒武紀增資至4.22億

大曉機器人正式發布行業首創的ACE具身研發范式

賽力斯公布車輛轉向防碰撞專利

邢自強：中國在人工智能上的投資十分有效

華為云城市峰會在烏蘭察布召開，當地已吸引67個數據中心項目

火山引擎的「火」，是怎么點起來的

馬斯克：非自動駕駛燃油車終將消亡最終的競爭力是智能化

XREAL 1S發布：3299元起，用一副眼鏡把500英寸巨幕“戴”在身上

歐洲頂尖神經學家：中國為科學家提供“絕佳機遇”

“元寶AI自動回復太像真人”引質疑騰訊為其發聲

2035年去月球“上班”！青年科學家蘇萌描繪未來圖景

中國氣象局：到2035年全面建成數值預報與人工智能優勢互補、融合統一的地球系統預報體系

電動巴士訂單排滿明年，比亞迪計劃在巴西擴建

海南封關首日iPhone最高可減2140元

中國氣象局：未來十年將在一批關鍵核心技術上實現突破