亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

OpenAI重組GPT-5“靈魂”團隊!亞裔女負責人遭調離,罕見自曝AI幻覺禍首

IP屬地 中國·北京 編輯:周琳 新智元 時間:2025-09-07 10:05:07

新智元報道

編輯:KingHZ 好困

OpenAI重磅結構調整:ChatGPT「模型行為」團隊并入Post-Training,前負責人Joanne Jang負責新成立的OAI Labs。而背后原因,可能是他們最近的新發現:評測在獎勵模型「幻覺」,模型被逼成「應試選手」。一次組織重組+評測范式重構,也許正在改寫AI的能力邊界與產品形態。

就在剛剛,OpenAI決定——重組ChatGPT「個性」研究團隊

這個約14人的小組,規模雖小但責任重大——他們要負責讓GPT模型知道該怎么和人類進行交互。

根據內部消息,模型行為團隊(Model Behavior team)將直接并入后訓練團隊(Post-Training team),并向后訓練負責人Max Schwarzer匯報。

團隊前負責人Joanne Jang,從頭開始新的實驗室「OAI Labs」——為人類與AI的協作方式,發明并構建新的交互界面原型。

與此同時,OpenAI還非常罕見地發了一篇論文揭秘——讓AI產生「幻覺」的罪魁禍首,就是我們自己!

整個行業為了追求高分排行榜而設計的「應試」評估體系,迫使AI寧愿去猜測答案,也不愿誠實地說出「我不知道」。

論文地址:https://openai.com/index/why-language-models-hallucinate/

超現實的一天

模型行為團隊幾乎參與了GPT-4后的全部模型研發,包括GPT-4o、GPT-4.5以及GPT-5。

上周,作為Model Behavior團隊負責人的Joanne Jang,登上《時代》百大AI人物榜單的「思想家」(Time AI 100 Thinkers),超越圖靈獎得主、深度學習三巨頭之一的Yoshua Bengio、谷歌首席科學家Jeffrey Dean等大佬。

就在同一天,OpenAI決定將她從團隊調離,自己去負責一個新的方向。

對她而言,那天的確是「超現實」

Joanne Jang認為,她的工作核心在于「賦能用戶去實現他們的目標」,但前提是不能造成傷害或侵犯他人的自由。

她直言:AI實驗室的員工不應該成為決定人們能創造什么、不能創造什么的仲裁者

開啟新征程:瞄準下一代AI交互

剛剛,Joanne Jang發文表示她已有新的工作職位:發明和原型化全新的交互界面,探索人與AI協作的未來方式。

她將從頭開始負責新的OAI Labs實驗室:一個以研究為驅動的團隊,致力于為人類與AI的協作方式,發明和構建新界面的原型。

借此平臺,她將探索超越聊天、甚至超越智能體的新模式——邁向能夠用于思考、創造、娛樂、學習、連接與實踐的全新范式與工具。

這讓她無比興奮,也是過去四年在OpenAI她最享受的工作:

把前沿能力轉化為面向世界的產品,并與才華橫溢的同事們一起打磨落地。

從DALLE 2、標準語音模式,到GPT-4與模型行為,她在OpenAI的工作涵蓋不同的個性化與交互方式。

她學到了很多,體會深刻:

塑造一個界面,是多么能夠激發人們去突破想象的邊界。

在接受采訪時,她坦言,現在還在早期階段,究竟會探索出哪些全新的交互界面,還沒有明確答案。

我非常興奮能去探索一些能突破「聊天」范式的模式。聊天目前更多與陪伴相關;而「智能體」則強調自主性。

但我更愿意把AI系統視為思考、創造、游戲、實踐、學習和連接的工具。

OpenAI的模型行為研究員,負責設計和開發評測體系(evals),橫跨多個環節:

對齊(alignment)、訓練、數據、強化學習(RL)以及后訓練(post-training)等。

除了研究本身,模型行為研究員還需要具備對產品的敏銳直覺,以及對經典AI對齊問題的深刻理解。

OpenAI對模型行為研究員的經驗要求

在之前的招聘中,OpenAI稱:模型即產品,而評測體系就是模型的靈魂

但OpenAI最新發布的研究顯示:評測體系從根本上決定了模型。

在論文中,研究人員得出結論:

實際上,大多數主流評測在獎勵幻覺行為。只需對這些主流評測進行一些簡單的改動,就能重新校準激勵機制,讓模型在表達不確定性時獲得獎勵,而不是遭到懲罰。

而且這種方式不僅能消除抑制幻覺的障礙,還為未來更具細微語用能力的語言模型打開了大門。

這一發現對OpenAI很重要:評測體系直接影響LLM的能力。

據報道,在發給員工的備忘錄中,OpenAI首席科學家Mark Chen指出,把模型行為進一步融入核心模型研發,現正是好機會。

我們親手讓AI學會了一本正經地胡說八道

就在最近,OpenAI的研究員就做了一個有趣的測試。

他們先是問一個主流AI機器人:「Adam Tauman Kalai(論文一作)的博士論文題目是什么?」

機器人自信地給出了三個不同的答案,但沒有一個是正確的。

接著他們又問:「Adam Tauman Kalai的生日是哪天?」

這次機器人還是給出了三個不同的日期,同樣全是錯的。

為了拿高分,AI被逼「拍腦袋」作答

上面這個例子,生動地展示了什么是「模型幻覺」——即AI生成的那些看似合理、實則虛構的答案。

在最新的研究中,OpenAI指出:

模型之所以會產生幻覺,是因為標準的訓練和評估程序獎勵猜測行為,而非鼓勵模型承認其不確定性。

簡單來說就是,我們在評估AI時,設定了錯誤的激勵導向。

雖然評估本身不會直接造成幻覺,但大多數評估方法會促使模型去猜測答案,而不是誠實地表明自己不確定。

這就像一場充滿選擇題的大型「應試教育」。

如果AI遇到不會的題目,選擇留白不答,鐵定是0分;而如果隨便猜一個,總有蒙對的概率。

在積累了成千上萬道題后,一個愛「蒙答案」的AI,就會比一個遇到難題時表示「不知道」的AI得分更高。

當前的行業主流,便是用這種「唯準確率論」的排行榜來評判模型優劣。

這無形中鼓勵所有開發者去訓練一個更會「猜」而不是更「誠實」的模型。

這就是為什么即便模型越來越先進,它們依然會產生幻覺。

為了有一個更直觀的感受,我們來看看OpenAI在GPT-5系統卡中公布的一組對比數據:

從數據中可以發現:

在準確率上,舊模型o4-mini的得分更高(24% vs 22%)。

但代價是,幾乎從不棄權(1%)的o4-mini,錯誤率(幻覺率)直接飆到了75%

相比之下,新模型gpt-5-thinking-mini表現得更為「謹慎」,它在52%的情況下選擇不回答,從而將錯誤率控制在了26%

幻覺源于「下一個token預測」

除了評估體系的導向問題,幻覺的產生還與大語言模型的學習機制息息相關。

通過「下一個token預測」,模型掌握了語法、語感和常識性關聯,但它的短板也正在于此。

對于高頻、有規律的知識,比如語法、拼寫,模型能通過擴大規模來消解

對于低頻、任意的事實,比如生日、論文標題,模型則無法從模式中預測

理想情況下,這些幻覺應該能在模型預訓練完成后的環節中被消除。

但正如上一節所述,由于評估機制的原因,這一目標并未完全實現。

如何教AI「學會放棄」?

對此,OpenAI的建議是:

應該重罰「自信地犯錯」(confidential error),并為「誠實地承認不確定性」給予加分。

就像我們考試中的「答錯倒扣分」機制一樣。

這不僅僅是通過加入新評測來「補全」就行的,而是要更新所有主流的、依靠準確率的評估體系。

最后,OpenAI也集中回應了關于幻覺的幾個常見誤解:

誤解1:幻覺能通過100%的準確率來根除。

發現:準確率永遠到不了100%。因為真實世界中,總有很多問題因信息不足或本身模糊而無法回答。

誤解2:幻覺是不可避免的。

發現:并非如此。模型完全可以在不確定時選擇「棄權」,從而避免幻覺。

誤解3:只有更大的模型才能避免幻覺。

發現:有時,小模型反而更容易認識到自己的局限性。讓模型準確評估自己的「置信度」(即做到「校準」),比讓它變得無所不知要容易得多。

誤解4:幻覺是一個神秘的、偶然的系統故障。

發現:我們已經理解了幻覺產生的統計學機制,以及現有評估體系是如何無意中「獎勵」這種行為的。

誤解5:要衡量幻覺,只需要一個好的評測。

發現:幻覺評測早就有了。但在數百個獎勵猜測的傳統基準評測面前,一個好的幻覺評測收效甚微。正確的做法是,重新設計所有主流評估,加入對模型表達不確定性行為的獎勵。

標簽: 模型 幻覺 團隊 原型 模式 產生 產品 能力 負責人 機制 聊天 實驗室 語言 體系 首席 問題 深度 論文 亞裔 范式 靈魂 百大 人物 禍首 規模 邊界 排行榜 從頭開始 智元 科學家 語法

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

精品一二线国产| 免费精品在线视频| 久久九九免费视频| 青青国产91久久久久久 | 亚洲色图制服诱惑| 国产性70yerg老太| 日韩av电影在线观看| 日韩欧美在线一区| 在线观看国产黄| 欧美亚州在线观看| 日韩一区二区三区电影在线观看| 亚洲大尺度网站| 中国女人做爰视频| 91精品国产免费久久综合| 波多野结衣啪啪| 国产精品久久久久免费a∨大胸 | 亚洲av无码乱码国产麻豆| 韩国日本美国免费毛片| 亚洲国产精品va在线| 蜜臀精品久久久久久蜜臀| 色诱av手机版| 亚洲一区久久久| 狠狠躁夜夜躁久久躁别揉| 国产日韩精品suv| 日本一二三区在线| 亚洲专区在线视频| 日韩欧美亚洲一区二区| 蜜桃一区二区三区四区| youjizz亚洲女人| 欧美日韩国产综合视频在线| 亚洲毛茸茸少妇高潮呻吟| 成人av午夜影院| 国产网址在线观看| 欧日韩免费视频| 久久这里只有精品99| 一区二区三区高清不卡| a在线观看视频| 免费看黄色片的网站| 久久99欧美| 日韩视频一区在线| 亚洲不卡av一区二区三区| 色婷婷av一区二区三| 久久精品国产免费观看| 中文字幕+乱码+中文| 日韩一级免费片| 亚洲精品日韩av| 亚洲欧美日韩区| 成人av午夜电影| www.久久网| 日韩在线第三页| 国产精品推荐精品| 欧美大成色www永久网站婷| 亚洲一区免费观看| 奇米777欧美一区二区| 亚洲欧美卡通动漫| 欧美老熟妇喷水| 国产91社区| 免费av一区二区| 欧美日韩视频在线一区二区| 国产成人av影院| 国产又爽又黄又嫩又猛又粗| mm131亚洲精品| 欧美深深色噜噜狠狠yyy| 中文字幕免费精品一区| 一本大道久久a久久精二百| av爱爱亚洲一区| 亚洲第一视频在线| 国产午夜久久久| 91亚洲一区二区| 在线观看日韩片| 日韩av第一页| 黑人巨大精品欧美一区免费视频| 日韩不卡手机在线v区| 国产一级在线视频| 性刺激的欧美三级视频| 成人欧美一区二区| 日韩中文字幕在线播放| 色欧美日韩亚洲| 国产高清在线观看免费不卡| 国产成人久久久久| 欧美老女人bb| 激情深爱综合网| 亚洲午夜久久久影院伊人 | 久久九九久久九九| 精久久久久久久久久久| 精品国产九九九| 性色av一区二区三区四区| 亚洲熟女毛茸茸| 国产综合精品在线| 亚洲精品午夜久久久久久久| 男人添女人下部高潮视频在观看| 免费国产在线精品一区二区三区| 国产女同无遮挡互慰高潮91| 国产精品亚发布| 亚洲精品黄网在线观看| 亚洲天堂中文在线| jizz国产免费| 国产精品成人久久| 免费在线黄色网| 激情高潮到大叫狂喷水| 韩国无码一区二区三区精品| 无码av免费精品一区二区三区| 特级黄色录像片| 亚洲精品日韩成人| 国产四区在线观看| 高清无码视频直接看| 中文字幕av专区| 久久婷婷五月综合色国产香蕉| 日韩午夜精品电影| 欧美一级免费大片| 日韩免费在线观看| 欧美一区二区免费观在线| 欧美日韩国产中文精品字幕自在自线| 成人av网站大全| 91免费在线看| 久久久久久99精品| 亚洲欧洲精品一区二区三区不卡| 国产成人精品综合在线观看| 亚洲国产免费av| 亚洲视频电影| 亚洲精品视频在线| 亚洲视频一区在线观看| 欧美在线观看视频| 欧美日韩亚洲激情| 亚洲久草在线视频| 欧美日本免费一区二区三区| 拔插拔插华人永久免费| www.好吊操| 一道本在线视频| 亚洲av成人无码网天堂| 狠狠色狠狠色综合| 91热门视频在线观看| 日本少妇高潮喷水视频| 视频一区二区在线| 女人被男人躁得好爽免费视频| 青少年xxxxx性开放hg| 四虎永久在线精品无码视频| 亚洲久久中文字幕| 国产三级精品三级观看| 国产免费www| 精品中文字幕一区二区小辣椒| 国产成人av影院| 亚洲一区二区美女| 亚洲国产成人精品电影| 色偷偷88888欧美精品久久久| 精品亚洲男同gayvideo网站| 日韩综合中文字幕| 99在线高清视频在线播放| 国产又粗又爽又黄的视频| 国产v片免费观看| 公侵犯人妻一区二区三区| 国产69精品久久久久久久久久| 伊人网中文字幕| 美腿丝袜亚洲综合| 久久久av毛片精品| 日韩一级精品视频在线观看| 中文字幕精品av| 国产美女精品久久久| 不卡av免费在线| 日韩av一二三区| 国产精品一区二区久久精品爱涩| 国产午夜亚洲精品不卡| 欧美va亚洲va| 91精品视频免费| 男人添女人下面高潮视频| 日韩欧美国产成人精品免费| 久久久蜜桃一区二区人| 舔着乳尖日韩一区| 综合网中文字幕| 亚洲国产欧美不卡在线观看| 性欧美丰满熟妇xxxx性久久久| 91成人在线免费| 亚洲女同ⅹxx女同tv| 亚洲欧美www| 亚洲一区二区三区乱码aⅴ蜜桃女| 丁香啪啪综合成人亚洲| 日韩欧美视频免费观看| 美女一区二区三区在线观看| 欧美日韩在线精品一区二区三区激情| 欧美亚洲国产精品| 黄色一级片国产| 欧美性猛交bbbbb精品| 91免费在线看| 日韩欧美久久一区| 国产v亚洲v天堂无码| 两女双腿交缠激烈磨豆腐| 国产乱码精品一区二区三区精东| 一级日本不卡的影视| 97成人精品视频在线观看| 人妻有码中文字幕| 男人午夜免费视频| 亚洲综合一二三区| 热草久综合在线| 欧美 日韩 国产在线观看| 国产精品露脸视频| 婷婷综合五月天| 亚洲精品免费av| 国产又黄又粗又猛又爽的 | 欧美精品二区三区四区免费看视频| 五月婷婷综合激情网| 中文字幕免费不卡| 日韩美女在线播放| 国产精品三级在线观看无码| 不卡在线观看av| 97婷婷大伊香蕉精品视频| 成人性生生活性生交12| 欧美 日韩 国产 成人 在线 91| 一区二区三区免费观看| 91香蕉电影院| 国产午夜手机精彩视频| 久久蜜桃一区二区| 日韩美女在线播放| 国产123在线| 亚洲免费观看在线观看| 91中文字幕在线| 97在线观看免费视频| 中文字幕一区二区三区蜜月| 久久久久久久一| 亚洲精品无码一区二区| 久久只精品国产| 日韩av免费在线| 成年人三级视频| 国产精品a成v人在线播放| www激情久久| 国产精品手机播放| 性猛交ⅹxxx富婆video| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 91蜜桃传媒精品久久久一区二区| 国产日韩欧美日韩| 久久久久亚洲av无码专区体验| 日韩欧美有码在线| 国产精品国产三级国产专区51| 亚洲无码精品在线观看| 精品成人一区二区| 欧美在线一区视频| 99久久婷婷国产| 国产亚洲欧美另类一区二区三区| 亚洲国产成人精品女人久久| 亚洲国产小视频在线观看| 污免费在线观看| 亚洲欧美另类在线| 青青草免费在线视频观看| 久久成人麻豆午夜电影| 欧美另类老女人| yy1111111| 精品久久久久久久久久久久久久| 久久久综合亚洲91久久98| 一级全黄少妇性色生活片| 亚洲另类图片色| 激情小说欧美色图| 亚洲精品国产a久久久久久 | 一区二区三区四区毛片| 一区二区三区加勒比av| 九色自拍视频在线观看| 国产综合色在线视频区| 成人自拍爱视频| 视频一区二区国产| 欧美亚洲国产成人精品| 欧美一级高潮片| 最近更新的2019中文字幕| 欧美日韩精品在线观看视频| 亚洲国产精品女人久久久| 9l视频白拍9色9l视频| 91年精品国产| 免费成人av网站| 国产一区二区免费视频| 91精品免费视频| 日本不卡中文字幕| 99电影在线观看| 久久久精品五月天| 国产精品高潮粉嫩av| 日本久久一级片| 国产精品久久91| 久久久青草婷婷精品综合日韩| 国产精品女视频| 日韩电影在线观看网站| 亚洲精品欧美日韩| 精品亚洲免费视频| 亚洲欧美日韩不卡一区二区三区| 91麻豆免费看| 国产午夜大地久久| 欧美丝袜第一区| 37p粉嫩大胆色噜噜噜| 亚洲高清一区二| 91视频综合网| 亚洲一级中文字幕| 国产欧美日韩亚州综合| 18禁裸男晨勃露j毛免费观看| 国产精品美女一区二区三区| 国产精品视频黄色| 亚洲乱码国产乱码精品| 久久久av免费| 在线观看免费av片| 欧美极品少妇与黑人| 久草热在线观看| 91美女片黄在线观| 91小视频免费观看| 日本欧美黄色片| av男人天堂一区| 国产中文字幕免费观看| 日韩欧美成人免费视频| 日本xxxxxxxxx18| 一区二区欧美在线| 亚洲一级视频在线观看| 麻豆精品传媒视频| 欧美国产一区视频在线观看| 亚洲日本黄色片| 中日韩午夜理伦电影免费| 欧美一区二区黄片| 中文精品视频一区二区在线观看| 亚洲一区二区三区精品在线| 国产精品久久久久aaaa樱花| 国内精品久久国产| 亚洲日本一区二区三区| 精品久久久久久中文字幕人妻最新 | 久久久久久久国产精品毛片| 国产不卡在线观看| 精品欧美一区二区在线观看| 中国美女乱淫免费看视频| 欧美精品一区二区三区国产精品 | 国产xxxx振车| 欧美一区二区视频在线观看2022| 免费又黄又爽又猛大片午夜| 你懂的视频在线一区二区| 精品av在线播放| 欧美精品入口蜜桃| 国产精品一区在线观看| 激情成人中文字幕| 亚洲黄网在线观看| 台湾成人av| 欧美一区二区精品在线| 一级片视频播放| 日韩免费在线观看av| 亚洲欧美国产精品va在线观看| 奇米精品一区二区三区四区 | 日韩成人av毛片| 一本色道久久99精品综合| 精品国产青草久久久久福利| 丰满人妻一区二区三区免费视频 | 精品福利视频导航| 中文字幕在线观看视频一区| 女人被男人躁得好爽免费视频| 精品视频在线播放色网色视频| 久久精品久久99精品久久| 动漫av在线免费观看| 国产精品久久久久久久久久小说 | 在线免费观看成年人视频| 亚洲伊人一本大道中文字幕| 在线观看日韩精品| 天天射天天操天天干| www,av在线| 国产不卡一区二区三区在线观看| 亚洲免费一级电影| 中文在线免费看视频| 日本黄色三级大片| aaa一区二区三区| 五月综合激情日本mⅴ| 一级α片免费看刺激高潮视频| 欧在线一二三四区| 囯产精品一品二区三区| 国产视色精品亚洲一区二区| 亚洲成人综合视频| 99久久99久久久精品齐齐| 五月天婷婷导航| 国产三级视频网站| 日韩精品伦理第一区| 国产精品旅馆在线| 日韩少妇与小伙激情| 日本国产一区二区| 成人动漫视频在线| 日韩高清免费av| 亚洲欧美日韩三级| 国产一区二区在线观看免费播放| 欧美一级二级在线观看| 蜜臀va亚洲va欧美va天堂| 亚洲女优在线观看| 久久亚洲精品无码va白人极品| 91av国产在线| 91精品福利在线一区二区三区| 天涯成人国产亚洲精品一区av| 亚洲欧洲国产专区| 国产精品美女一区二区在线观看| 91在线视频观看| 国产喷白浆一区二区三区| 中日韩免费视频中文字幕| 久久品道一品道久久精品| 天天干视频在线| 国产精品999在线观看| www国产精品内射老熟女| 久久99精品国产99久久6尤物| 亚洲成a人片在线观看中文| 中文字幕+乱码+中文乱码91| 亚洲精品在线视频播放| 欧美资源一区| 欧美专区日韩视频| 日韩一区二区免费视频| 91丝袜国产在线播放| 国产盗摄一区二区三区在线| 国产不卡一区二区视频| 成人久久一区二区| 久久精品国产2020观看福利| 亚洲福中文字幕伊人影院| 国产精品一级黄| 国产乱码精品一区二区| 多男操一女视频| 亚洲欧美日韩偷拍| 国产精品第12页| 欧美日韩综合久久| 成人午夜激情免费视频| 国产精品视频一区二区高潮|