AI教父本希奧宣布開發誠信系統，防范智能體欺騙人類

IP屬地中國·北京 編輯：陸辰風新浪財經 時間：2025-06-04 19:09:41

6 月 4 日消息，金融時報（FT）昨日（6 月 3 日）發布博文，報道稱“AI 教父”約書亞?本希奧（Yoshua Bengio）成立 LawZero 非營利組織，致力于開發“誠實”的 AI 系統，用以識別“流氓”AI 系統。
IT之家簡要介紹下本希奧，他是來自蒙特利爾大學的教授，因與 Geoffrey Hinton、Yann LeCun 共享 2018 年圖靈獎（被視為計算機領域的諾貝爾獎），而被譽為“AI 教父”。
LawZero 的使命是開發一種“誠實”的 AI，專門監控那些無需人類干預即可執行任務的 AI 智能體，防止它們表現出欺騙或自我保護行為，例如試圖阻止人類關閉系統。
本希奧正在研發的系統名為 Scientist AI，旨在成為 AI 智能體的“守衛”。他將現有的 AI 智能體比作“演員”，它們模仿人類、取悅用戶，而 Scientist AI 則更像一位“心理學家”，能夠理解并預測不良行為。
該系統不會給出確切答案，而是以概率形式評估答案的正確性，體現出一種“謙遜”態度。它還能預測 AI 智能體行為導致危害的概率，若概率超過閾值，系統將阻止相關行動。
IT之家

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

【新書】《生命傳》：基因不是答案，而是問題的開始

“飛天”健身器上天！青島英派斯為航天員健康護航

空客最暢銷窄體客機首次在中國進行高難度機身系統裝配

向新而行·育見未來丨武漢：打造人形機器人完整生態體系為全球具身智能發展提供 “武漢方案”

宇樹科技王興興亮相國新辦：未來3至5年，人形機器人應用將加速

機器人共舞“智”造“新”時刻

全站最新

Windows 11任務欄至今仍無法自由移動！微軟終于給出原因：沒用舊代碼

東安動力首臺轉子發動機R05E點火成功，2027年量產

挑戰液態海洋共識：NASA研究稱土衛六含太陽系最大“冰沙”

曝TikTok交易達成，美國和字節跳動各掌握一家公司

熱門推薦

【新書】《生命傳》：基因不是答案，而是問題的開始

“飛天”健身器上天！青島英派斯為航天員健康護航

空客最暢銷窄體客機首次在中國進行高難度機身系統裝配

向新而行·育見未來丨武漢：打造人形機器人完整生態體系為全球具身智能發展提供 “武漢方案”

宇樹科技王興興亮相國新辦：未來3至5年，人形機器人應用將加速

機器人共舞“智”造“新”時刻

黃仁勛：中國有非常獨特的優勢發展人形機器人

迎接下一個AI浪潮，近千只機器人概念股集體“躁動”

武漢市力爭2027年人形機器人產業規模超100億元

對話 | 做“金字塔尖”的手術機器人

“傳遞能量方塊”開啟！未來一個月機器人將在北京街頭“快閃”

聚焦人形機器人關鍵領域開展技術創新，多位湖北省政協委員建言科技創新和產業創新融合發展

古人發明的3大“奇技淫巧”，有的物件，放到現在仍算是高科技

《疫苗冷鏈上鏈：99.6%合規率背后的物聯網+區塊鏈融合》

折疊屏手機選購指南：這三款旗艦讓你一手掌握未來科技