當(dāng)前位置：首頁 ? 資訊 ? 科技探索 ? 正文

“AI 教父”本希奧宣布開發(fā)“誠信”系統(tǒng)，防范智能體欺騙人類

IP屬地中國·北京 編輯：江紫萱 IT之家 時間：2025-06-04 19:02:52

6 月 4 日消息，金融時報（FT）昨日（6 月 3 日）發(fā)布博文，報道稱“AI 教父”約書亞?本希奧（Yoshua Bengio）成立 LawZero 非營利組織，致力于開發(fā)“誠實”的 AI 系統(tǒng)，用以識別“流氓”AI 系統(tǒng)。
簡要介紹下本希奧，他是來自蒙特利爾大學(xué)的教授，因與 Geoffrey Hinton、Yann LeCun 共享 2018 年圖靈獎（被視為計算機領(lǐng)域的諾貝爾獎），而被譽為“AI 教父”。
LawZero 的使命是開發(fā)一種“誠實”的 AI，專門監(jiān)控那些無需人類干預(yù)即可執(zhí)行任務(wù)的 AI 智能體，防止它們表現(xiàn)出欺騙或自我保護行為，例如試圖阻止人類關(guān)閉系統(tǒng)。
本希奧正在研發(fā)的系統(tǒng)名為 Scientist AI，旨在成為 AI 智能體的“守衛(wèi)”。他將現(xiàn)有的 AI 智能體比作“演員”，它們模仿人類、取悅用戶，而 Scientist AI 則更像一位“心理學(xué)家”，能夠理解并預(yù)測不良行為。
該系統(tǒng)不會給出確切答案，而是以概率形式評估答案的正確性，體現(xiàn)出一種“謙遜”態(tài)度。它還能預(yù)測 AI 智能體行為導(dǎo)致危害的概率，若概率超過閾值，系統(tǒng)將阻止相關(guān)行動。
LawZero 的初始支持者包括 AI 安全機構(gòu) Future of Life Institute、Skype 創(chuàng)始工程師 Jaan Tallinn 以及前谷歌 CEO Eric Schmidt 創(chuàng)立的 Schmidt Sciences。LawZero 初始資金約 3000 萬美元，擁有十余名研究人員，本希奧擔(dān)任主席。
本希奧表示，該項目第一步是驗證該概念的方法論是否可行，隨后說服企業(yè)或政府支持更大規(guī)模、更強大的版本。他計劃從開源 AI 模型入手訓(xùn)練系統(tǒng)，并呼吁投入更多資源，確保“守衛(wèi)”AI 與前沿 AI 同步發(fā)展。他警告，若 AI 智能體能在無人類監(jiān)督下完成更長任務(wù)序列，可能引發(fā)“嚴重”破壞。

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系我們，本站將會在24小時內(nèi)處理完畢。

同類資訊

【新書】《生命傳》：基因不是答案，而是問題的開始

“飛天”健身器上天！青島英派斯為航天員健康護航

空客最暢銷窄體客機首次在中國進行高難度機身系統(tǒng)裝配

向新而行·育見未來丨武漢：打造人形機器人完整生態(tài)體系為全球具身智能發(fā)展提供 “武漢方案”

宇樹科技王興興亮相國新辦：未來3至5年，人形機器人應(yīng)用將加速

機器人共舞“智”造“新”時刻

全站最新

松鼠Ai徐藝涵獲評福布斯中國“影響力教育人物”獎：以AI之智，共筑教育未來

網(wǎng)傳拿下SpaceX低軌衛(wèi)通相控陣天線量產(chǎn)訂單，碩貝德回應(yīng)

將復(fù)古風(fēng)貫徹到底，現(xiàn)代下一代索納塔被曝將致敬80年代初代車型

榮耀MagicOS十二月功能上新：一句話P圖、全品牌互聯(lián)等

熱門推薦

【新書】《生命傳》：基因不是答案，而是問題的開始

“飛天”健身器上天！青島英派斯為航天員健康護航

空客最暢銷窄體客機首次在中國進行高難度機身系統(tǒng)裝配

向新而行·育見未來丨武漢：打造人形機器人完整生態(tài)體系為全球具身智能發(fā)展提供 “武漢方案”

宇樹科技王興興亮相國新辦：未來3至5年，人形機器人應(yīng)用將加速

機器人共舞“智”造“新”時刻

黃仁勛：中國有非常獨特的優(yōu)勢發(fā)展人形機器人

迎接下一個AI浪潮，近千只機器人概念股集體“躁動”

武漢市力爭2027年人形機器人產(chǎn)業(yè)規(guī)模超100億元

對話 | 做“金字塔尖”的手術(shù)機器人

“傳遞能量方塊”開啟！未來一個月機器人將在北京街頭“快閃”

聚焦人形機器人關(guān)鍵領(lǐng)域開展技術(shù)創(chuàng)新，多位湖北省政協(xié)委員建言科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新融合發(fā)展

古人發(fā)明的3大“奇技淫巧”，有的物件，放到現(xiàn)在仍算是高科技

《疫苗冷鏈上鏈：99.6%合規(guī)率背后的物聯(lián)網(wǎng)+區(qū)塊鏈融合》

折疊屏手機選購指南：這三款旗艦讓你一手掌握未來科技