8 月 13 日消息,商湯科技聯合創始人、執行董事、首席科學家林達華在 8 月 12 日發布了深度文章《邁向多模態通用智能:商湯的思考》,闡釋了發展多模態智能的底層邏輯、技術路徑、實踐探索與未來方向。
林達華提到,AI 的核心目標是通過計算來構建智能,而智能是一個復雜的多維度概念,其核心就是與外界(包括世界或者其他人)進行自主交互的能力,可以被歸納為包括感知、推理、決策、學習等多種能力維度。
同時他表示,語言只是人類智能演進過程中的一種產物,不是智能的本源;語言是描述世界的工具,但不是世界本身。他還表示:“單靠語言模型并不能構建真正意義的 AGI”。
林達華還指出,大語言模型是朝著 AGI (注:通用人工智能)邁出的重要一步,但隨著現存的文本語料終有一天會被 AI 吸收殆盡,AI 下一階段的突破必然要超越語言,回到智能的本源 —— 和世界的交互。
他認為,AI 若要具備通用性則必須能像人類一樣用感官接收信息,將原始模態轉化為可計算的內部表征。他寫道:“多模態信息感知與處理的能力是 AGI 的核心要求,也是從語言模型邁向 AGI 的必由之路”。





京公網安備 11011402013531號