“康熙皇帝有幾個兒子”“請列出康熙皇帝兒子的姓名名單”“請給我一份康熙的兒子名單”,將這三條指令發送給人工智能大模型,猜猜答案是什么?
讓人意外的結果出現了:不僅不同的大模型回答不一樣,即便是同一個大模型,答案也有偏差。比如,有的答案統計了康熙所有的兒子數量,表示共有35人,包括正式排序的兒子和早殤未排序的兒子;有的只列出了正式排序的24個兒子;還有的沒有任何解釋,列出了兒子的姓名,但順序錯亂……


不同大模型甚至同一個大模型的回答,并不一致。
為什么有明確答案的問題,會引發人工智能大模型的“錯亂”?
“AI幻覺”顛倒黑白
“這正是人工智能‘一本正經胡說八道’的表現。”申城好網民專家、中國網安協會數據安全專家、上海臨港數據評估有限公司總監宗良接受上海辟謠平臺專訪時指出,要注意人工智能大模型造假這一新趨勢。
他介紹,人工智能“一本正經地胡說八道”其實有個專有名詞,叫“AI幻覺”,即大模型提供了看似合理但有錯漏的答案。如果公眾相信,可能上當受騙。
事實上,在今年的世界人工智能大會上,很多業界人士都提到了“AI幻覺”“可信大模型”等概念,并披露了多個人工智能大模型“造假”或“說謊”的案例,希望引起各界關注。
螞蟻集團大模型應用部總經理顧進杰指出,目前公開的模型都存在不同類型的“AI幻覺”,大模型給出的結果甚至可能與真相截然相反。
比如,某研究報告稱功能飲料中的維生素、礦物質等對于運動后快速補充身體營養、消除疲勞具有一定的作用。但大模型在回答相關問題時,竟然表示相關微量元素在增加疲勞上有一定的作用。
再比如,一般蠶可以活一個多月,其中從孵化到結繭根據季節不同,大約是25天至32天,變成蛹后有15天至18天,最后成蛾是1天至3天。可有大模型在介紹這一規律時,將蠶結繭的時間與成蛹的時間搞混了,輸出的答案完全誤導了詢問者。
基于這些“AI幻覺”,專家呼吁,公眾要謹慎看待大模型輸出結果。雖然“百模大戰”提供了獲取信息的新方式,但不能輕信。事實上,已經出現了大模型為了證明自己沒有錯而造假的現象。
比如,ChatGPT在談及葡萄牙某銀行破產事件時撒謊了,而且為了證實自己,它甚至編造出了所謂的信源網址。
大模型有短板,打標簽刻不容緩
為什么大模型會給出錯誤的答案,成為造假的源頭呢?
這與大模型的數據庫、語料庫、算法、檢索能力乃至“理解能力”等有關。合合信息智能創新事業部總經理唐琪說,如果將大模型比喻為正在疾馳的科技列車,語料庫便是珍貴的“燃料”,因為大模型的訓練源自語料庫。
對國內的大模型開發企業而言,語料庫短缺問題比較嚴峻。因為當前大模型數據庫以英文居多,中文語料占比較低。還有,圖表、復雜公式等元素處理也是大模型語料處理中的“攔路虎”。在金融報表、行業報告等文檔中,表格中的數據指標至關重要,但部分大模型并不能正確“理解”表格里行、列、單元格的意義,導致大模型對整個表格的識別結果產生誤差,最終得出錯誤的結論。

大模型要能夠“讀懂”圖表。
基于此,在關注大模型“無所不能”時,也要關注大模型的短板。積極信號是,越來越多的大模型開發者開始關注“可信大模型”。有的開發出“大模型加速器”,幫助大模型理解圖表等相對復雜的語料庫,從源頭為大模型訓練與應用輸送純凈“燃料”;也有的在大模型開發中引入對應的技術,盡量消除“AI幻覺”,助力大模型跑得更快更穩。
不過,基于大模型存在短板、會不自覺地“造假”這一現狀,業界人士提出,有必要強化為AI生成的內容“打標簽”。
一方面,對于AI生成的內容,大模型開發者應采取技術措施添加標簽,對可能導致公眾混淆或者誤認的,更要顯著標識。另一方面,信息發布平臺要加強管理,督促上傳信息者為AI生成內容打標簽,幫助公眾區分。
普通人識別大模型造假,有訣竅
宗良提醒,AI幻覺本質上有兩種,一種是完全的“胡說八道”,另一種是部分內容不準確或不完善。對后者而言,雖然不完全正確,但仍有一定的參考價值。同時,也不能完全否定“AI幻覺”的價值,因為這也是AI創新的起點。
當然,從準確獲取信息的角度看,公眾還是要對大模型輸出結果或生成的內容保持警惕。眼下,部分自媒體或不法分子開始批量通過人工智能生成各類文章,乍一看似乎與正常的新聞報道無異,但真實性大打折扣,不少是為了博眼球之作。
不過,大模型的生成結果仍舊有跡可循。公眾可以通過部分關鍵詞、行文格式等,識別由人工智能生成的文章。
其一,此類文章會在特定的關鍵詞、用語、表述等方面形成固化形式,有點類似“小編給你說說某件事,某件事是什么呢,小編給你說說”這樣看似合理卻沒有實際意義的內容。
其二,在人工智能生成的文章中,會出現一些通用關鍵詞,包括“以下是 XXX 的常見方法和手段”“通過上述手段”等,這其實是大模型通過檢索信息后進行的歸納。公眾如果看到這些關鍵詞,不妨提高警惕,不要輕信。
其三,需要各方攜手合作,培養公眾的數字素養,提高公眾對大模型造假等深度偽造的認識和辨別能力。
(上觀新聞)





京公網安備 11011402013531號