康熙有幾個兒子？人工智能的回答出人意料

IP屬地中國·北京 編輯：周偉深圳新聞網 時間：2024-07-16 08:53:26

“康熙皇帝有幾個兒子”“請列出康熙皇帝兒子的姓名名單”“請給我一份康熙的兒子名單”，將這三條指令發送給人工智能大模型，猜猜答案是什么？
讓人意外的結果出現了：不僅不同的大模型回答不一樣，即便是同一個大模型，答案也有偏差。比如，有的答案統計了康熙所有的兒子數量，表示共有35人，包括正式排序的兒子和早殤未排序的兒子；有的只列出了正式排序的24個兒子；還有的沒有任何解釋，列出了兒子的姓名，但順序錯亂……
不同大模型甚至同一個大模型的回答，并不一致。
為什么有明確答案的問題，會引發人工智能大模型的“錯亂”？
“AI幻覺”顛倒黑白
“這正是人工智能‘一本正經胡說八道’的表現。”申城好網民專家、中國網安協會數據安全專家、上海臨港數據評估有限公司總監宗良接受上海辟謠平臺專訪時指出，要注意人工智能大模型造假這一新趨勢。
他介紹，人工智能“一本正經地胡說八道”其實有個專有名詞，叫“AI幻覺”，即大模型提供了看似合理但有錯漏的答案。如果公眾相信，可能上當受騙。
事實上，在今年的世界人工智能大會上，很多業界人士都提到了“AI幻覺”“可信大模型”等概念，并披露了多個人工智能大模型“造假”或“說謊”的案例，希望引起各界關注。
螞蟻集團大模型應用部總經理顧進杰指出，目前公開的模型都存在不同類型的“AI幻覺”，大模型給出的結果甚至可能與真相截然相反。
比如，某研究報告稱功能飲料中的維生素、礦物質等對于運動后快速補充身體營養、消除疲勞具有一定的作用。但大模型在回答相關問題時，竟然表示相關微量元素在增加疲勞上有一定的作用。
再比如，一般蠶可以活一個多月，其中從孵化到結繭根據季節不同，大約是25天至32天，變成蛹后有15天至18天，最后成蛾是1天至3天。可有大模型在介紹這一規律時，將蠶結繭的時間與成蛹的時間搞混了，輸出的答案完全誤導了詢問者。
基于這些“AI幻覺”，專家呼吁，公眾要謹慎看待大模型輸出結果。雖然“百模大戰”提供了獲取信息的新方式，但不能輕信。事實上，已經出現了大模型為了證明自己沒有錯而造假的現象。
比如，ChatGPT在談及葡萄牙某銀行破產事件時撒謊了，而且為了證實自己，它甚至編造出了所謂的信源網址。
大模型有短板，打標簽刻不容緩
為什么大模型會給出錯誤的答案，成為造假的源頭呢？
這與大模型的數據庫、語料庫、算法、檢索能力乃至“理解能力”等有關。合合信息智能創新事業部總經理唐琪說，如果將大模型比喻為正在疾馳的科技列車，語料庫便是珍貴的“燃料”，因為大模型的訓練源自語料庫。
對國內的大模型開發企業而言，語料庫短缺問題比較嚴峻。因為當前大模型數據庫以英文居多，中文語料占比較低。還有，圖表、復雜公式等元素處理也是大模型語料處理中的“攔路虎”。在金融報表、行業報告等文檔中，表格中的數據指標至關重要，但部分大模型并不能正確“理解”表格里行、列、單元格的意義，導致大模型對整個表格的識別結果產生誤差，最終得出錯誤的結論。
大模型要能夠“讀懂”圖表。
基于此，在關注大模型“無所不能”時，也要關注大模型的短板。積極信號是，越來越多的大模型開發者開始關注“可信大模型”。有的開發出“大模型加速器”，幫助大模型理解圖表等相對復雜的語料庫，從源頭為大模型訓練與應用輸送純凈“燃料”；也有的在大模型開發中引入對應的技術，盡量消除“AI幻覺”，助力大模型跑得更快更穩。
不過，基于大模型存在短板、會不自覺地“造假”這一現狀，業界人士提出，有必要強化為AI生成的內容“打標簽”。
一方面，對于AI生成的內容，大模型開發者應采取技術措施添加標簽，對可能導致公眾混淆或者誤認的，更要顯著標識。另一方面，信息發布平臺要加強管理，督促上傳信息者為AI生成內容打標簽，幫助公眾區分。
普通人識別大模型造假，有訣竅
宗良提醒，AI幻覺本質上有兩種，一種是完全的“胡說八道”，另一種是部分內容不準確或不完善。對后者而言，雖然不完全正確，但仍有一定的參考價值。同時，也不能完全否定“AI幻覺”的價值，因為這也是AI創新的起點。
當然，從準確獲取信息的角度看，公眾還是要對大模型輸出結果或生成的內容保持警惕。眼下，部分自媒體或不法分子開始批量通過人工智能生成各類文章，乍一看似乎與正常的新聞報道無異，但真實性大打折扣，不少是為了博眼球之作。
不過，大模型的生成結果仍舊有跡可循。公眾可以通過部分關鍵詞、行文格式等，識別由人工智能生成的文章。
其一，此類文章會在特定的關鍵詞、用語、表述等方面形成固化形式，有點類似“小編給你說說某件事，某件事是什么呢，小編給你說說”這樣看似合理卻沒有實際意義的內容。
其二，在人工智能生成的文章中，會出現一些通用關鍵詞，包括“以下是 XXX 的常見方法和手段”“通過上述手段”等，這其實是大模型通過檢索信息后進行的歸納。公眾如果看到這些關鍵詞，不妨提高警惕，不要輕信。
其三，需要各方攜手合作，培養公眾的數字素養，提高公眾對大模型造假等深度偽造的認識和辨別能力。
（上觀新聞）

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

《電腦愛好者》雜志公眾號注銷、官網無法訪問，創刊至今已32年

剛說淘汰中國激光雷達，最后希望的 Luminar 就破產了？

王力宏伴舞機器人高難度后空翻后穩穩落地，馬斯克點贊！

長城歐拉出奇招：“一車多動力”打破單點競爭

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

全站最新

《電腦愛好者》雜志公眾號注銷、官網無法訪問，創刊至今已32年

剛說淘汰中國激光雷達，最后希望的 Luminar 就破產了？

王力宏伴舞機器人高難度后空翻后穩穩落地，馬斯克點贊！

長城歐拉出奇招：“一車多動力”打破單點競爭

熱門推薦

《電腦愛好者》雜志公眾號注銷、官網無法訪問，創刊至今已32年

剛說淘汰中國激光雷達，最后希望的 Luminar 就破產了？

王力宏伴舞機器人高難度后空翻后穩穩落地，馬斯克點贊！

長城歐拉出奇招：“一車多動力”打破單點競爭

上饒農商行被罰240萬，上饒銀行被罰170萬

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

雷軍轉發！小米汽車又獲獎再引發輿論安全追問

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

降息，突發！集體拉升，近8萬人爆倉！

給AI一雙眼睛：XR眼鏡正在重塑下一代智能終端

摩爾線程技術路線圖全面公開！刷新國產GPU推理天花板，新架構能效飆10倍

中科大造出首個紫外光譜成像芯片，成本有望直降99%

將RNA的自毀密碼寫入塑料：科學家實現高分子材料的可編程降解