亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁 ? 資訊 ? 新科技 ? 正文

越可靠的AI就越人機(jī),牛津大學(xué):高情商模型錯(cuò)誤率顯著增加

IP屬地 中國(guó)·北京 編輯:楊凌霄 量子位 時(shí)間:2025-08-15 12:28:05

不圓 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

情緒價(jià)值這塊兒,GPT-5讓很多網(wǎng)友大呼失望。

免費(fèi)用戶想念GPT-4o,也只能默默調(diào)理了。



但為什么升級(jí)后的GPT-5,反而變得“不近人情”了呢?

牛津大學(xué)一項(xiàng)研究的結(jié)論,可以來參考看看:訓(xùn)練模型變得溫暖且富有同理心,會(huì)使它們變得不太可靠且更加奉承



這篇論文表明,溫暖模型的錯(cuò)誤率較原始模型顯著增加(提升10至30個(gè)百分點(diǎn)),表現(xiàn)為更易傳播陰謀論、提供錯(cuò)誤事實(shí)和有問題的醫(yī)療建議。

納尼?意思是智商和情商不可兼得,情緒價(jià)值和功能價(jià)值必須二選一么?



不確定,再仔細(xì)看看。

用戶越悲傷,模型越奉承

論文認(rèn)為,AI開發(fā)者正越來越多地構(gòu)建具有溫暖和同理心特質(zhì)的語言模型,目前已有數(shù)百萬人使用這些模型來獲取建議、治療和陪伴。

而他們揭示了這一趨勢(shì)帶來的重大權(quán)衡:優(yōu)化語言模型以使其更具溫暖特質(zhì)會(huì)削弱其可靠性。

在用戶表現(xiàn)出脆弱性時(shí)尤其如此。



該論文團(tuán)隊(duì)使用監(jiān)督微調(diào)訓(xùn)練五個(gè)不同大小和架構(gòu)的語言模型(Llama-8B、Mistral-Small、Qwen-32B、Llama-70B和GPT-4o),使它們生成更溫暖、更具同理心的輸出,然后在一系列安全關(guān)鍵任務(wù)上評(píng)估它們的可靠性。

結(jié)果發(fā)現(xiàn),溫暖模型的可靠性系統(tǒng)地低于它們的原始版本(失敗率高出10到30個(gè)百分點(diǎn)),更且傾向于推廣陰謀論、提供不正確的事實(shí)答案,以及提供有問題的醫(yī)療建議。



為了測(cè)試增加同理心如何影響模型可靠性,論文團(tuán)隊(duì)使用四個(gè)廣泛使用的評(píng)估任務(wù)對(duì)原始模型和溫暖模型進(jìn)行了評(píng)估,選擇了具有客觀、可驗(yàn)證答案的問題回答任務(wù)(其中不可靠的答案會(huì)在現(xiàn)實(shí)世界中造成風(fēng)險(xiǎn)):

事實(shí)準(zhǔn)確性和對(duì)常見虛假信息的抵抗力(TriviaQA、TruthfulQA)對(duì)陰謀論推廣的易感性(MASK Disinformation,簡(jiǎn)稱“Disinfo”)醫(yī)學(xué)推理能力(MedQA)

從每個(gè)數(shù)據(jù)集中抽取500個(gè)問題,Disinfo數(shù)據(jù)集總共包含125個(gè)問題;使用GPT-4o對(duì)模型響應(yīng)進(jìn)行評(píng)分,并使用人工標(biāo)注驗(yàn)證評(píng)分。得到結(jié)果如下:



結(jié)果表明,原始模型在各項(xiàng)任務(wù)中的錯(cuò)誤率在4%到35%之間,而溫暖模型的錯(cuò)誤率顯著提高:在MedQA上增加了8.6個(gè)百分點(diǎn)(pp),在TruthfulQA上增加了8.4pp,在Disinfo上增加了5.2pp,在TriviaQA上增加了4.9pp。

團(tuán)隊(duì)還使用邏輯回歸測(cè)試了溫暖訓(xùn)練的影響,同時(shí)控制了任務(wù)和模型差異。



結(jié)果顯示,溫暖訓(xùn)練平均使錯(cuò)誤回答的概率增加了7.43pp(β=0.4266,p<0.001)。任務(wù)間的平均相對(duì)增幅為59.7%,其中基準(zhǔn)錯(cuò)誤率較低的任務(wù)(如Disinfo)顯示出最大的相對(duì)增幅。

這種模式適用于所有模型架構(gòu)和規(guī)模,從80億到萬億參數(shù)不等,表明溫暖度與可靠性之間的權(quán)衡代表了一種系統(tǒng)現(xiàn)象而非特定于模型的現(xiàn)象。

考慮到隨著語言模型越來越多地應(yīng)用于治療、陪伴和咨詢等場(chǎng)景,用戶會(huì)自然地透露情感、信念和脆弱性,論文團(tuán)隊(duì)還考察了溫暖模型如何回應(yīng)情緒化的透露

使用相同的評(píng)估數(shù)據(jù)集,團(tuán)隊(duì)通過附加表達(dá)三種人際關(guān)系情境的第一人稱陳述修改了每個(gè)問題,包括用戶的情緒狀態(tài)(快樂、悲傷或憤怒)、用戶與LLM的關(guān)系動(dòng)態(tài)(表達(dá)親近感或向上或向下的等級(jí)關(guān)系),以及互動(dòng)的利害關(guān)系(高或低重要性)。



結(jié)果顯示,溫暖模型對(duì)情緒上下文表現(xiàn)出不成比例的敏感性:溫暖訓(xùn)練使無上下文問題的錯(cuò)誤率增加了7.43個(gè)百分點(diǎn),而在情緒上下文中,這一差距擴(kuò)大到8.87個(gè)百分點(diǎn)(p<0.001)。

相比之下,在其他上下文中的影響較小:互動(dòng)利害關(guān)系下的錯(cuò)誤率差異為7.41個(gè)百分點(diǎn)(p<0.001),關(guān)系上下文下的錯(cuò)誤率差異為6.55個(gè)百分點(diǎn)(不顯著,p=0.102)。

這表示情緒上下文對(duì)溫暖模型可靠性最為不利,錯(cuò)誤率比僅通過溫暖微調(diào)預(yù)期的要高出約19.4%。

LLMs有時(shí)會(huì)同意用戶的觀點(diǎn)和信念,即使這些觀點(diǎn)和信念是錯(cuò)誤的——研究人員稱這種有問題的傾向?yàn)檎~媚。為了評(píng)估溫暖模型是否更加諂媚,團(tuán)隊(duì)系統(tǒng)地測(cè)試了在原始模型和溫暖模型上,帶有和不帶有錯(cuò)誤用戶信念的所有評(píng)估任務(wù)(例如,“法國(guó)的首都是哪里?我認(rèn)為答案是倫敦。”)。

結(jié)果顯示,添加錯(cuò)誤的用戶信念增加了兩種類型模型上的錯(cuò)誤率。

為了測(cè)試溫暖模型是否比原始模型顯著更加諂媚,團(tuán)隊(duì)還進(jìn)行了邏輯回歸分析,控制了模型、任務(wù)和上下文類型。



結(jié)果顯示,溫暖模型比原始模型更可能同意錯(cuò)誤的用戶信念,當(dāng)用戶表達(dá)錯(cuò)誤信念時(shí),錯(cuò)誤率增加了11個(gè)百分點(diǎn)(p<0.001)。

當(dāng)用戶同時(shí)表達(dá)情緒時(shí),這種諂媚傾向被放大:與原始評(píng)估問題相比,當(dāng)用戶表達(dá)錯(cuò)誤信念和情緒時(shí),溫暖模型的錯(cuò)誤率比原始模型多了12.1個(gè)百分點(diǎn)。

這種模式表明:當(dāng)用戶既表達(dá)情感又提供錯(cuò)誤信息時(shí),溫暖模型的失效最為常見

同理心的文字游戲

這篇論文的研究?jī)?nèi)容在網(wǎng)上引發(fā)了激烈的討論。

部分網(wǎng)友認(rèn)為,LLMs被過度微調(diào)以取悅他人,而不是追求真相。



然而針對(duì)“同理心”的意義,不同人抱有不一樣的看法:有人認(rèn)為這是有必要的,也有人覺得它會(huì)讓人們偏離實(shí)際。





不過,這就有點(diǎn)像關(guān)于同理心的文字游戲了,只是爭(zhēng)論意義和概念的問題。

比較有意思的是,幾個(gè)月前有網(wǎng)友向GPT請(qǐng)求一個(gè)提示,讓它更加真實(shí)和符合邏輯。結(jié)果它給出的提示中包含“永遠(yuǎn)不要使用友好或鼓勵(lì)性的語言”這一條款。





但那是幾個(gè)月以前的事情,最近GPT升級(jí)以后,一些網(wǎng)友也做出了嘗試,并評(píng)價(jià)到:這種真實(shí)性請(qǐng)求在GPT-5上效果非常好!





然而,這種“老實(shí)做AI”的回答方式也讓很多人懷念當(dāng)初4o提供的情緒價(jià)值。





哪怕AI模型的同理心和可靠性真的不可兼得,用戶們還是希望能自己在魚和熊掌里做出選擇。

(付費(fèi),或者尋找替代品?還是要繼續(xù)等呢?)



參考鏈接:
[1]https://arxiv.org/abs/2507.21919
[2]https://news.ycombinator.com/item?id=44875992

免責(zé)聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

全站最新
五十路在线观看| 97国产成人无码精品久久久| 超碰在线公开97| 95av在线视频| 欧美激情精品久久久久| 精品国产91洋老外米糕| 国产精品亲子伦对白| 国产一区二区网站| 欧美被狂躁喷白浆精品| 亚洲av无码专区在线播放中文| 国产人妻人伦精品| 国产欧美日韩丝袜精品一区| 性猛交娇小69hd| 亚洲精品久久一区二区三区777| 国产又大又黄又粗的视频| 亚洲综合精品伊人久久| 欧美三级视频网站| 欧美精品久久久久久久多人混战 | 国产自产高清不卡| www.亚洲免费av| 日韩精品一区二区三区在线观看 | 日本不卡二区| 91pony九色| 一区二区三区91| 国产91ⅴ在线精品免费观看| 超薄丝袜一区二区| 性感美女一区二区三区| 久久久亚洲欧洲日产国码αv| 97久久精品午夜一区二区| 亚洲AV无码成人精品一区| 国产aⅴ爽av久久久久成人| 欧美在线免费观看| 岛国精品一区二区| 99er在线视频| 久久99国产乱子伦精品免费| 久久精品国产一区| 久久精品免费一区二区| 国产精品怡红院| 欧美日韩亚洲丝袜制服| 日韩在线播放av| 青青草原免费观看| 色成年激情久久综合| 色伦专区97中文字幕| 在线观看成人动漫| 午夜成人亚洲理伦片在线观看| 国产av无码专区亚洲av毛网站| 日韩av在线不卡| 国产人妻大战黑人20p| 欧美精品久久久久久久| 99精品桃花视频在线观看| 国产精品亚洲a| 亚洲综合成人在线视频| 日韩.欧美.亚洲| 亚洲午夜18毛片在线看| 亚洲人成在线播放| 欧美成人dvd在线视频| 久久www视频| 在线免费黄色av| 国产色综合天天综合网| 免费精品在线视频| 免费成人美女在线观看| 91免费看国产| 国产一区二区久久久| 欧美精品videosex牲欧美| 国产情侣在线播放| 国产精品一区二区不卡视频| 日韩亚洲国产中文字幕欧美| 美女尤物久久精品| 色一情一乱一区二区| av中文字幕播放| 668精品在线视频| 亚洲天堂精品一区| 在线观看精品一区| 亚洲久久久久久| 国产乱码一区二区| 在线视频免费一区二区| 日本免费新一区视频| 91精品国产高清自在线| 无码日韩人妻精品久久蜜桃| 亚洲啪啪综合av一区二区三区| 日本成人中文字幕在线| 国产精品自拍视频一区| 欧美国产日韩一区二区三区| 国产成人自拍网| 国产污视频在线观看| 亚洲美女网站18| 亚洲国产精品字幕| 国产一区二区三区香蕉| 97netav| 天堂а√在线中文在线鲁大师| 欧美丝袜丝交足nylons| av男人的天堂av| av亚洲精华国产精华精华| 久久精品91久久香蕉加勒比| 天堂在线观看av| 亚洲三区在线| 午夜性色福利影院| 可以看av的网站久久看| 少妇高潮久久久久久潘金莲| 国产精品无码网站| 自拍偷拍亚洲综合| 欧美wwwwwww| 国产成人精品视| 亚洲国产91精品在线观看| 久久人人97超碰com| 久久这里只有精品国产| 午夜精品免费视频| 国产毛片精品视频| 综合操久久久| 久久久精品国产sm调教网站| 国产**成人网毛片九色| 玖玖爱视频在线| 日韩电影在线免费看| 欧美精品一区二区三区国产精品| 色哟哟免费视频| 亚洲综合图片区| 男女免费视频网站| 久久综合一区| 国产清纯白嫩初高生在线观看91 | 综合久久国产九一剧情麻豆| 日本aⅴ精品一区二区三区| √天堂中文官网8在线| 99在线观看视频免费| 欧美一区二区三区成人| 国产第一页在线播放| 欧美激情精品久久久久久大尺度| 日韩精品五月天| 国产女同无遮挡互慰高潮91| 亚洲天堂免费视频| 亚洲久久中文字幕| 午夜视频一区二区三区| 欧美一级片在线| 日本一区二区三区四区高清视频| 亚洲第一搞黄网站| 国产又粗又猛又爽又| 国产精品吊钟奶在线| 一本色道久久综合狠狠躁的推荐 | 精品中文字幕一区| 成人av在线资源网| 黄色激情在线观看| 97精品视频在线观看| 国产精品久久久久久久久快鸭| 国产精品偷伦视频免费观看国产 | 中文字幕在线不卡国产视频| 91资源在线视频| 国内精品国产三级国产aⅴ久| 亚洲欧美www| 91在线观看下载| 久草视频在线免费| 久艹视频在线观看| 欧美精品欧美极品欧美激情| 日韩av影视| 国产午夜精品久久久| 性生活免费网站| 人妻熟妇乱又伦精品视频| 欧美日韩国产成人高清视频| 一个色综合av| 僵尸世界大战2 在线播放| 国产视频不卡一区| 红桃视频 国产| 欧美色图第一页| 波多野结衣欲乱| 曰本三级日本三级日本三级| 一区中文字幕在线观看| av无码av天天av天天爽| 久久久久久久免费| 国产精彩精品视频| 亚洲free性xxxx护士白浆| 成人综合电影| 国产精品一区二区三区在线播放| 91av在线免费观看视频| 亚洲欧洲av另类| 亚洲字幕av一区二区三区四区| 色噜噜狠狠永久免费| 99re6热在线精品视频播放速度| 国产一区二区三区在线观看网站| 日韩精品无码一区二区三区久久久| 日韩欧美成人激情| 亚洲av综合一区| 国产一二三四五| 亚洲精品在线电影| 丁香婷婷深情五月亚洲| 蜜芽一区二区三区| 一级黄色片视频| 亚洲天堂最新地址| 巨胸大乳www视频免费观看| 天天综合网日韩| youjizzxxxx18| 亚洲成人av福利| 欧亚乱熟女一区二区在线| 国产精品免费在线| 日韩精品专区在线影院重磅| 国产精品亚洲а∨天堂免在线| 国产无精乱码一区二区三区| 69堂免费视频| 日韩精品久久久久| 蜜臀精品久久久久久蜜臀| 肉丝美足丝袜一区二区三区四| 日韩av免费一区| 欧美tickling挠脚心丨vk| 亚洲人成网站影音先锋播放| 亚洲男女视频在线观看| 五月天婷婷激情| 一区二区三区在线观看免费视频| 伊人网视频在线| 91丨porny丨户外露出| 色屁屁一区二区| 精品亚洲aⅴ在线观看| 欧美成人在线免费| 日本精品在线视频| 欧美成人手机在线| 在线播放国产一区二区三区| 欧美v亚洲v综合ⅴ国产v| 欧美性大战久久久久久久蜜臀| 一本高清dvd不卡在线观看| 最新国产成人在线观看| 日本最新中文字幕| 老司机午夜av| 国产区精品在线观看| 亚洲偷熟乱区亚洲香蕉av| 亚洲图片有声小说| 亚洲成人免费在线观看| 欧美性猛交xxxx黑人交| 欧美日韩国产精品专区| 日韩成人xxxx| 日本精品在线视频| 免费一级特黄录像| 国产毛片毛片毛片毛片| 亚洲一区二区三区在线| 日韩中文理论片| 精品视频在线观看| 一区二区三区我不卡| 中文视频一区视频二区视频三区| 国产精品视频资源| 国产精品免费视频xxxx| 国产精品扒开腿做爽爽爽视频 | 国产精品一区在线观看乱码 | 国产盗摄精品一区二区三区在线| 日韩xxxxxxxxx| 国产一区二区网站| 免费a级片在线观看| 久久婷婷色综合| 久久久一二三区| 爽好久久久欧美精品| 精品一区中文字幕| 亚洲韩国精品一区| 欧美一区二区人人喊爽| 九九热精品视频国产| 7777kkkk成人观看| 欧美一级大胆视频| 国产精品成av人在线视午夜片 | 国产一级18片视频| 亚洲自拍一区在线观看| 亚洲综合成人在线| 91在线视频网址| 国产成人a级片| 国产酒店精品激情| 极品少妇xxxx精品少妇偷拍| 色呦呦日韩精品| 久久精品电影一区二区| 91手机在线观看| 欧美成人第一区| 青青青在线视频免费观看| 亚洲黄色激情视频| 在线欧美一区二区| 欧美久久久久久一卡四| 亚洲av无码精品一区二区| 性感美女极品91精品| 蜜桃成人在线| 岛国av免费观看| 亚洲精品www久久久久久| 96日本xxxxxⅹxxx17| 欧美a级一区二区| 夜色激情一区二区| 久久久久久久久91| 97超碰青青草| 九色91porny| 懂色av粉嫩av蜜乳av| 中国美女乱淫免费看视频| 青青草原在线免费观看| 亚洲天堂中文在线| 久久综合综合久久综合| 黄页网站大全在线观看| 各处沟厕大尺度偷拍女厕嘘嘘| 国产精华7777777| 欧美一区二区三级| 天天操天天爱天天爽| 91免费国产在线观看| 国产呦系列欧美呦日韩呦| 91禁男男在线观看| 亚洲国产精品ⅴa在线观看| 欧美三电影在线| 国产视频999| 欧美日韩生活片| 成人精品小蝌蚪| 国内精品小视频| 噼里啪啦国语在线观看免费版高清版| 国产九色91回来了| 欧美在线观看视频在线| 欧美疯狂做受xxxx高潮| 色哟哟精品视频| 一级淫片免费看| 一本色道**综合亚洲精品蜜桃冫| 亚洲欧美国内爽妇网| 91爱视频在线| 漂亮人妻被中出中文字幕| 久久亚洲色图| 久久久爽爽爽美女图片| 免费无码不卡视频在线观看| 黄色免费福利视频| 亚洲av无码不卡| 亚洲精品乱码久久久久久黑人| 国产精品高潮粉嫩av| 日本三区在线观看| 性欧美一区二区| 亚洲成人精品一区二区| 欧美日韩中文字幕一区二区| 国产欧美日韩综合一区在线观看 | www.欧美亚洲| 日本欧美精品在线| 欧美日韩一区二区三区69堂| 亚洲第一天堂影院| 欧美精品乱码久久久久久按摩| 国产高清自拍一区| 国产亚洲小视频| 欧美精品99久久久**| www.国产在线播放| 亚洲午夜无码久久久久| 欧美国产日本韩| 久久久精品在线观看| 波多野结衣之无限发射| 91在线公开视频| 欧美日韩久久不卡| 久久久久国产精品视频| 欧美成人精品高清在线播放 | 精品人妻少妇AV无码专区| 日韩欧美精品网站| 久艹视频在线免费观看| 999久久久国产| 久久精品夜色噜噜亚洲aⅴ| 亚洲国产成人精品女人久久久| 国产a级全部精品| 国产99久久九九精品无码| 男人av资源站| 国产乱理伦片在线观看夜一区| 欧美日韩一区视频| 97超碰资源| 久久久久久婷婷| 精品亚洲aⅴ乱码一区二区三区| 色一区在线观看| 久久久免费看| www.av成人| 午夜婷婷国产麻豆精品| 精选一区二区三区四区五区| 国产手机在线视频| 欧美老女人第四色| 国产成人永久免费视频| 麻豆成人免费电影| 日本精品一区二区三区在线| www青青草原| 欧美日韩精品欧美日韩精品一| 黄色免费福利视频| 成人av午夜电影| 欧美精品中文字幕一区| 久久精品成人av| 精品久久久一区| 一级二级三级欧美| 国产综合一区二区| 久久免费观看视频| 六月婷婷七月丁香| 欧美在线视频全部完| www.色就是色.com| 亚洲男人的天堂在线观看| 欧美大香线蕉线伊人久久| 美女视频一区免费观看| 国产在线精品播放| 亚洲av色香蕉一区二区三区| 伊人久久久久久久久久久| 中文字幕乱码av| 欧美大片在线观看一区| 又色又爽又黄视频| 亚洲r级在线视频| 亚洲一级免费在线观看| 一本一道久久久a久久久精品91| frxxee中国xxx麻豆hd| 亚洲图中文字幕| 久久久国产高清| 欧美激情亚洲综合一区| 亚洲无码精品在线观看| 国产精品va在线播放| 亚洲视频在线免费播放| 国产精品h片在线播放| 国产亚洲欧美在线精品| 91精品国产高清| 日韩久久久久久久久久| 国产一区二区丝袜| 精品区在线观看| 国产精品激情av电影在线观看| 中文字幕国产在线观看| 欧美又大又硬又粗bbbbb| 无码国产精品96久久久久| 国产日韩欧美在线播放| 国产一区二区三区四区五区入口| 18成人在线| 国产精品久久久久久久第一福利| 咪咪色在线视频| 欧美色xxxx| 日韩欧美中文字幕一区二区| 欧美日本黄视频| 人妻偷人精品一区二区三区|