亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

GPT 4o-mini華人領隊離開OpenAI:真正推動AI進步不是模型架構,而是互聯網

IP屬地 中國·北京 編輯:柳晴雪 新智元 時間:2025-08-19 14:22:21


新智元報道

編輯:定慧

前OpenAI研究員Kevin Lu加盟由前OpenAI CTO Mira Murati創立的Thinking Machines Lab。公司2025年7月獲約20億美元早期融資,估值約120億美元。Kevin Lu曾主導GPT-4o mini,長期研究強化學習、小模型與合成數據。

剛剛,OpenAI又離職一名華人大佬

前OpenAI研究員Kevin Lu宣布加入AI新創Thinking Machines Lab


Kevin Lu主導了GPT-4o mini的發布,并參與o*-mini、o3等模型工作。

Thinking Machines Lab由前OpenAI CTO Mira Murati創立的。

2025年7月,公司創歷史完成20億美元的超大額早期融資(a16z領投),估值約120億美元。

隨后團隊核心成員在社交平臺上互動表示歡迎。



Kevin Lu是強化學習與小模型方向的研究者,本科就讀于加州大學伯克利分校,在OpenAI期間專注強化學習、Small Models與合成數據。


加入Thinking Machines之前還在Hudson River Trading、metaAI從事序列決策與深度學習研究。

真正推動AI進步的是互聯網

Kevin Lu在小模型與合成數據上的實踐經驗,有助于Thinking Machines縮短從論文到用戶價值的距離。

尤其是他7月的一篇博客非常出圈:真正推動AI進步是互聯網

深入淺出的講明白一個事情:與其反復摳架構,不如擴大、豐富、貼近現實的數據來源(如互聯網)與數據消耗方式,否則模型始終「見得少、懂得少」。


博客地址:https://kevinlu.ai/the-only-important-technology-is-the-internet

以下為博客的部分截取翻譯:

雖然AI的進步常被歸功于一些里程碑論文——比如transformers、RNNs、diffusion——但這忽略了AI最根本的瓶頸:數據

那么,「好數據」究竟意味著什么?

如果我們真想推進AI,與其研究深度學習優化,不如研究「互聯網」。

互聯網才是讓我們的AI模型實現規模化擴展的那項關鍵技術。

· Transformers是一種「分散注意力」

受架構創新帶來的快速進展啟發(5年間從AlexNet到Transformer),許多研究者一直在尋找更好的架構先驗,寄望于設計出「優于Transformer」的新架構。

事實上,Transformer之后確實出現了一些更好的架構;但為什么自GPT-4以來,我們很難「切身感到」這種改進?


· 范式更迭

算力受限(compute-bound)。

曾經,方法隨算力擴展,更高效的方法就更好。

真正重要的是把數據盡可能高效地塞進模型里;這些方法不僅效果更好,而且似乎「越大越靈」。


然后,數據受限(data-bound)。

研究模型架構當然不是沒用。社區在Transformer之后開發出了更好的方法,比如SSMs與Mamba等。

但它們并非「免費的勝利」:在給定訓練算力下,訓練一個Transformer往往能得到更優性能。

數據綁定的范式是自由的:反正各種方法最終都差不多!

因此應選擇推理階段更優的方法,可能是某種「次二次注意力變體」(subquadratic attention variant)。

這些方法很可能會再度走到臺前。

· 研究者該做什么?

設想我們不只關心推理(可以理解為「產品」),而是關心漸近性能(可以理解為朝著AGI邁進):

顯然,只優化架構是錯的。

調整Q-function軌跡裁剪也不對。

手工打造新數據集無法擴展

花哨的「時間高斯探索」(new temporal Gaussian exploration method)也大概率不具擴展性。

社區的許多成員已經達成共識:應研究新的「數據消費」方式

目前兩大主流范式是:(1)下一個token預測(NTP)與(2)強化學習(RL)

(顯然,我們在「新范式」上并沒取得太多突破)

AI的本質就是「消耗數據」

目前AI領域里程碑工作本質上是在開辟數據消耗&消耗的新途徑:

AlexNet(2012):用「下一個token預測」的視角來「消化」ImageNet。

GPT-2(2019):用下一個詞預測來學習互聯網文本。

原生多模態(如GPT-4o、Gemini 1.5):用下一個詞預測吸收互聯網的圖像與音頻。

ChatGPT:在聊天場景中用強化學習攝取隨機的人類偏好獎勵

DeepSeek-R1在狹窄領域用強化學習攝取確定且可驗證的獎勵

「下一個token預測」而言,互聯網是完美的解決方案:它提供了極其豐富的、按序相關的數據,正好適合序列建模去學習。


互聯網充滿了結構化HTML的「序列」,天生適配下一個token預測;按不同順序重構,可以涌現多種有用能力。

這不是巧合:這種「序列數據」對下一個token預測近乎完美;互聯網與下一個token預測相輔相成

「行星級」數據

Alec Radford在2020年的一個先見之明的演講中指出:盡管當時提出了很多新方法,但都不如「擴大與整理數據」重要。


我們從「寄望更好方法帶來神奇泛化(比如損失函數暗含句法樹)」,轉向一個樸素原則:模型沒被告知的事,它當然不知道

與其通過打造大規模監督數據集去「硬性指定預測目標」,不如設法讓模型從「外部的一切」中學習并進行預測

每次我們做一個數據集,就像是把「世界上其他一切」的重要性設為0、把「數據集內的一切」的重要性設為1。

可憐的模型!它們知道的太少,仍有太多被隱藏。


自GPT-2之后,全球開始關注OpenAI,而時間也證明了其影響力。

如果有Transformer但沒有互聯網?

低數據。在低數據范式里,Transformer可能一文不值:其「架構先驗」不如CNN或RNN,因此表現應更差。

書籍。較不極端的情況是:若無互聯網,我們可能用書籍/教材進行預訓練。教材常被視為人類智慧的巔峰:作者受過良好教育,字斟句酌。這代表一種信念:「高質量數據勝于大數量數據」。


教材與Phi。Phi系列(「Textbooks Are All You Need」)在小模型上表現出色,但仍要依賴在互聯網訓練的GPT-4做過濾與合成。

總體看,Phi很不錯,但尚未證明能達到以互聯網數據預訓練模型的漸近性能;且教材缺少大量現實世界與多語言知識(不過在算力受限下它們很強)。

「數據類別」的類比

可把「教材」視作可驗證獎勵(表述幾乎總是真),而「書籍」(尤其是創作類)更像是「人類偏好」,能賦予學生模型更強的風格多樣性。

就像我們可能不會讓o3或Sonnet 3.7替我們寫作一樣,只在高質數據上訓練的模型可能缺少某種創造性「火花」。

因此Phi的PMF(產品市場契合)并不理想:需要知識時,人們偏好大模型;要本地「角色寫作」,人們也不太會選Phi。

互聯網之美

書與教材本質上只是互聯網數據的壓縮(背后或許有強大智能在做壓縮)。

更上一層看,互聯網極其多樣化的監督源,也人類的映射


展示了互聯網用戶在過去三十多年里由幾百萬躍升到50多億的長期、持續增長

一些研究者可能覺得「為了研究進步要轉向產品」很奇怪(甚至是干擾),但如果我們關心AGI對人類有益(而不是像AlphaZero那樣在真空中聰明),就該考慮AGI的形態(產品)

我認為研究(預訓練)與產品(互聯網)的協同設計非常優雅。


去中心化與多樣性

互聯網是去中心化的,任何人都能民主地添加知識;不存在單一真理源。

它承載了大量視角、文化模因和低資源語言;若用大模型在其上預訓練,便能得到理解廣博知識的智能。

這意味著,互聯網的管理者(產品「管家」)對AGI的設計舉足輕重!

若削弱互聯網多樣性,模型在做RL時的「熵」(信息多樣度)會顯著變差;若刪除數據,AGI中的整個亞文化都可能被抹去。

對齊。有非常有趣的結果表明:為了得到對齊的模型,必須同時在對齊與未對齊數據上預訓練,因為預訓練會學到二者之間線性可分的方向

如果去除未對齊數據,模型就難以理解「什么是不對齊,以及為何這是不好的數據」。(有點善惡共存,無善無惡的味道了)


上圖指標越高(「Toxigen」)表示毒性越強。

含10%有毒數據+人工引導上預訓練的模型,0%有毒數據+引導上預訓練的模型更不毒

特別是,上述「有毒」數據來自4chan,這是一個匿名在線論壇,以其無限制的討論和有害內容而聞名。

盡管這是一個產品與研究之間存在緊密聯系的特定案例(我們需要這種無限制討論來實現對齊的研究模型),但我認為你可以想到更多類似的案例,其中互聯網的設計決策在訓練后影響了最終結果。


非對齊的另一個例子:Improving Image Generation with Better Captions推動了DALL·E 3的發展。

通過重寫標注以更清晰地區分「好/壞圖像」,如今已廣泛用于生成模型。

這與RLHF的「點贊/點踩」在精神上相似。

「苦澀的教訓」

必須牢記:人們確實想使用互聯網,而這些有用性質都是與「互聯網這一產品」互動的涌現結果

如果我們總是手工整理數據就會出現「被整理的內容」與「用戶覺得有用的能力」之間的二元對立

有用的技能不應由研究者來拍腦袋選,用戶會告訴你答案。

「人們想使用互聯網」的另一半原因是:人均成本足夠低,才能普及并匯聚數據。若互聯網需要昂貴訂閱,就不會有大規模數據貢獻。

人們常在「擴展性」討論里忽略這一點:互聯網是那個能擴展學習與搜索(數據與計算)的簡單理念

若你找到這種「簡單理念」并把它做大,就會收獲卓越成果。

要點。互聯網之所以對訓練極有用,是因為:

1)多樣,蘊含大量有用知識;

2)形成天然課程

3)有產品市場契合,用戶持續供數;

4)經濟可行,單人成本低、可普及。

互聯網是「下一個token預測」的「對偶」

互聯網對監督式的下一個token預測是如此完美的補充,以致我們甚至可以強說:給定互聯網這個「底座」,研究者幾乎必然會收斂到下一個token預測

因此我會說:互聯網就是「下一個token預測」的對偶


如上所述,盡管我們做了大量研究,當下仍只有兩大范式

因此,提出新的「產品」點子可能比提出新的「學習范式」更容易。這引出問題:強化學習的「對偶」是什么?

現在有一些想法,但各有缺陷。它們都不算「純研究」,都涉及圍繞RL打造產品

我們期望的屬性是:多樣性、天然課程、PMF、經濟可行性

最后一評:犧牲一些多樣性也可以——在自家產品里用RL優化指標(游戲、自動售貨機、留存/利潤/參與度等)。

這可能有效,但難點在于:如何把它「升格」為一種多樣化、可擴展的獎勵宇宙,從而引發范式級躍遷

總之,我們還遠未找到一個像「互聯網之于NTP」那樣優雅且高產的「RL對偶」。


最后,Kevin Lu再次強調,在訓練里,模型只「看到」數據集里的東西;集外的世界等于被忽略(0 權重)。

希望有朝一日我們將找到方法來解決這個問題。

參考資料:

https://x.com/_kevinlu/status/1942977315031687460


免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

一区二区在线免费视频| 国产精品丝袜久久久久久不卡| 国产mv免费观看入口亚洲| 三区精品视频观看| 特种兵之深入敌后| 日产精品久久久久久久| 日本特黄久久久高潮| 国产无人区一区二区三区| 欧美视频在线一区二区三区 | 国产精品乱人伦中文| 欧美一级高清片| 国产欧美韩国高清| youjizzxxxx18| 国产剧情在线视频| 久久综合九色综合久久久精品综合| 欧美精品日韩综合在线| 国产伊人精品在线| 一区二区三区 日韩| 成人一二三四区| 欧美韩国日本一区| 日韩在线激情视频| 国产精品美女在线播放| avtt天堂在线| 99免费精品在线| 日韩电影网在线| 另类视频在线观看+1080p| b站大片免费直播| 美国毛片一区二区三区| 欧美精品第一页| 91日韩在线视频| 亚洲午夜精品一区| 黄色美女一级片| 一本久久a久久精品亚洲| 国产精品69av| 成人免费黄色av| 五月婷婷综合久久| 在线日韩国产精品| 99三级在线| 中文字幕国产专区| 成人av网址在线| 中文字幕久久久| 国产91沈先生在线播放| 销魂美女一区二区| 亚洲国产精品综合小说图片区| 欧美国产日韩一区二区三区| 成人黄色片视频| 国产三级第一页| 欧洲中文字幕精品| av日韩中文字幕| 亚洲毛片亚洲毛片亚洲毛片| 91毛片在线观看| 欧美激情高清视频| 亚洲第一色av| 麻豆成人免费电影| 亚洲人成伊人成综合网久久久| 福利在线小视频| 一级片视频免费| 欧美曰成人黄网| 欧美成人在线免费观看| 日韩免费av片| 天天操天天干天天综合网| 亚洲最大福利网| 91香蕉国产视频| 国产精品久久久久久久久久免费看 | 亚洲精选一区二区| 国产日本在线播放| 视频污在线观看| 日韩经典中文字幕| 成人黄色片视频| 日本欧美在线看| 亚洲系列中文字幕| 9l视频白拍9色9l视频| 看国产成人h片视频| 久久色在线播放| 特黄特黄一级片| 99久久久无码国产精品| 欧洲亚洲免费视频| 国产探花视频在线| 午夜在线电影亚洲一区| 欧美日韩在线观看一区| 这里只有精品国产| 精品成人免费观看| 日日噜噜夜夜狠狠| 国产乱国产乱300精品| 久久久中文字幕| x88av在线| 亚洲福利视频导航| 色噜噜狠狠色综合网| 国产乱码精品一区二区三区精东| 亚洲经典中文字幕| 中文字幕丰满乱码| 久久久蜜桃精品| 91久久偷偷做嫩草影院| 免费黄色av片| 亚洲精品福利在线观看| 亚洲男人天堂av在线| 久久精品男人的天堂| 99久久无色码| hs视频在线观看| 最近更新的2019中文字幕| 黄色性视频网站| 曰韩精品一区二区| 四虎免费在线观看视频| 蜜桃视频在线观看一区二区| 欧美亚洲另类制服自拍| 国产真实乱人偷精品视频| 欧美日韩视频不卡| 无人在线观看的免费高清视频| 成人中文字幕在线| 亚洲mm色国产网站| 欧美精品 国产精品| 麻豆一区二区三| 91精品国产福利在线观看| 国产精品涩涩涩视频网站| 成人福利在线看| 翡翠波斯猫1977年美国| av老司机久久| 久久久99免费视频| 四虎影院中文字幕| 日韩一区二区电影| 久久av一区二区三| 欧美老女人bb| 日本中文字幕片| 国产精品中文久久久久久久| 国产日韩欧美在线| 中文字幕第80页| 少妇高潮av久久久久久| 国产亚洲欧美一区在线观看| 欧美精品一区二区久久婷婷| 99免费在线观看视频| 天天操天天干天天做| 中文字幕网址在线| 亚洲欧洲三级电影| 国产在线拍揄自揄视频不卡99| av观看免费在线| 日本一区中文字幕| 视频直播国产精品| 精品999在线| 国产成人精品亚洲精品色欲| 一区二区在线免费| 欧美精品激情在线| 999热精品视频| 91色.com| 国产一区不卡在线观看| 91中文字幕永久在线| 亚洲影院在线观看| 国内精品二区| 波多野结衣黄色| 欧美日韩激情在线| 日韩美女爱爱视频| 丝袜美腿成人在线| 欧美极品少妇xxxxⅹ裸体艺术| 日本50路肥熟bbw| 国产成人一区在线| 国产精品免费在线免费 | 99久久激情视频| 日本在线不卡一区| 亚洲欧美中文另类| 亚洲人成色77777| 国产69精品久久99不卡| 91高跟黑色丝袜呻吟在线观看| 青青草原在线免费观看| 色丁香久综合在线久综合在线观看 | 久久久影院一区二区三区| 91亚洲精品国偷拍自产在线观看 | 亚洲精品无码久久久久久久| 丰满岳乱妇一区二区三区| 国内自拍欧美激情| 成人免费a视频| 亚洲男人天堂九九视频| 久久亚洲AV成人无码国产野外| 一区二区三区视频在线观看| 强开小嫩苞一区二区三区网站| 国产一区二区剧情av在线| 亚洲伊人久久综合| 亚洲 欧美 自拍偷拍| 国产精品视频在线观看| 亚洲中文无码av在线| 久久中国妇女中文字幕| 一级片黄色录像| 欧美va亚洲va香蕉在线| 一二三av在线| 亚洲资源在线观看| 中文 日韩 欧美| 亚洲国产日韩综合久久精品| 亚洲色图 在线视频| 婷婷夜色潮精品综合在线| 国产原创精品在线| 亚洲免费观看高清完整版在线 | 婷婷在线免费视频| 5566av亚洲| 成人午夜碰碰视频| 亚洲成人动漫在线| 国产精品成人一区二区艾草| 国产玉足脚交久久欧美| 夜夜夜精品看看| 波多野结衣中文字幕在线播放| 精品视频在线看| 30一40一50老女人毛片| 中文字幕日韩有码| 久久久精品国产sm调教网站| 精品国产一二三区| 日韩欧美不卡视频| 国产精品久久9| 国产成人99久久亚洲综合精品| 污污网站在线观看视频| 精品国产三级a在线观看| 国产高清不卡视频| 亚洲伊人成综合成人网| 中文字幕一区日韩精品欧美| 日韩成人精品视频在线观看| 欧美日免费三级在线| 97精品人妻一区二区三区香蕉| 国产麻豆一区二区三区在线观看| 国产亚洲成av人在线观看导航| 国产一级做a爰片久久| 欧美一级久久久| 亚洲精品一区二区三区影院忠贞| 精品国产一区二区在线| 久久久久久黄| www亚洲成人| 亚洲18私人小影院| 免费成人在线网站| 成人免费无码大片a毛片| 91亚洲一区精品| 日本精品一区二区三区高清| 在线免费日韩av| 亚洲一区影院| 亚洲成人久久电影| 伊人网站在线观看| 青青草久久网络| 欧美视频一区二区三区四区| 国模无码一区二区三区| 亚洲久久中文字幕| 国产区精品在线观看| 在线中文字幕一区| 久久夜色精品国产噜噜亚洲av| 91九色对白| 精品国内片67194| 国产精品88888| 波多野结衣网页| 久久亚洲高清| 亚洲精选一区二区| 国产精品视频九色porn| 在线观看国产亚洲| 亚洲精品乱码久久久久久动漫| 91久久国产精品91久久性色| 91极品美女在线| 午夜18视频在线观看| 肉丝美足丝袜一区二区三区四| 97精品国产97久久久久久免费| 欧美国产精品久久| 亚洲午夜在线播放| 蜜桃精品一区二区| 亚洲精品久久久久久一区二区| 国产亚洲日本欧美韩国| 久久青草国产手机看片福利盒子| 搜索黄色一级片| 日本免费高清一区二区| 热久久这里只有| 精品成人免费观看| 亚洲欧美偷拍三级| 亚洲精品综合久久| 日韩男人的天堂| 日韩女优在线视频| 成人免费在线视频播放| 国产精品视频免费在线| 久久亚洲影音av资源网| 精品视频在线免费看| 亚洲一区二区三区四区在线免费观看 | 成人www视频在线观看| 亚洲大胆人体视频| 久久一区二区三区四区| 毛片基地黄久久久久久天堂| 日韩欧美三级视频| 中文字幕三级电影| 欧美午夜免费| 午夜精品蜜臀一区二区三区免费 | 伊人久久亚洲综合| 成人做爰69片免费| 中日韩av在线播放| 今天免费高清在线观看国语| 51精品国产黑色丝袜高跟鞋 | 四虎4hu永久免费入口| 99re视频| 国产精品黄视频| 另类色图亚洲色图| 日韩一二三四区| 亚洲成人tv网| 亚洲国产精品视频| 亚洲欧美在线另类| 亚洲一区在线视频| 亚洲情趣在线观看| a亚洲天堂av| 国产女主播一区| 国产精品国产三级国产普通话99| 成人综合在线网站| 99久久精品费精品国产一区二区| 成人小视频免费在线观看| 日日嗨av一区二区三区四区| 91尤物国产福利在线观看| 欧美色图亚洲激情 | 国产又粗又长又大视频| 亚洲精品男人的天堂| 精品久久免费视频| 在线观看天堂av| 亚洲日本视频在线观看| 九九热视频精品| 一区二区视频在线免费观看| 一级黄色a视频| 色婷婷中文字幕| 91亚洲精华国产精华精华液| 国产欧美日韩三级| 亚洲欧美一区二区久久| 欧美日韩精品一区二区三区四区| 欧美性猛交xxxx黑人| 日韩欧美国产一二三区| 欧美激情videoshd| 国产精品入口免费视频一| 精品欧美国产| 蜜臀久久99精品久久久酒店新书| 99久久99精品| 男女做爰猛烈刺激| 国产尤物在线视频| 久久99这里只有精品| 精品久久久久久中文字幕| 欧美在线观看一区二区| 日韩在线视频免费观看| 精品国产91亚洲一区二区三区www| 精选一区二区三区四区五区| 日本午夜精品一区二区| 一级黄色电影片| 国产精品自拍第一页| 久久精品人人做人人爽人人| 欧美日韩一区中文字幕| 欧美国产精品va在线观看| 欧美韩国日本精品一区二区三区| 高清一区二区视频| 国产一二三四区在线| 少妇高潮久久久| 色天天综合久久久久综合片| 在线亚洲午夜片av大片| 日本中文不卡| 99re久久精品国产| 天堂在线资源网| 欧洲生活片亚洲生活在线观看| 久久天天躁狠狠躁夜夜躁| 特大黑人娇小亚洲女mp4| 精品国产_亚洲人成在线| 在线亚洲人成电影网站色www| 99久久99久久精品免费观看| 日本在线不卡视频| 亚洲综合网站在线观看| 亚洲全黄一级网站| 2021狠狠干| 久久亚洲春色中文字幕久久久| 国产精品日韩在线观看| 唐朝av高清盛宴| 污片在线观看一区二区| 999在线观看视频| 国产精品一二三| 91在线在线观看| 一级片免费在线播放| 亚洲在线一区二区三区| 99中文字幕| 中文字幕在线视频免费| 日韩欧亚中文在线| 日本高清久久一区二区三区| 国产乱理伦片在线观看夜一区 | 久久国产天堂福利天堂| 国产成人精品无码免费看夜聊软件| 日韩1区2区日韩1区2区| 91视频免费在线| 日本少妇久久久| 日韩性生活视频| www.色国产| 国产99999| 欧美在线一二三区| 欧美性色xo影院| 日本在线观看视频网站| 成人激情电影一区二区| 久久精品人人爽人人爽| 奇米精品一区二区三区| 欧美一区二区久久| 刘亦菲国产毛片bd| 91精品国产免费久久综合| 中文字幕 欧美日韩| 亚洲欧美综合在线精品| 欧美精品卡一卡二| 图片区小说区区亚洲影院| 爆乳熟妇一区二区三区霸乳| 国产美女一区二区三区| 日韩精品大片| 亚洲欧美日韩动漫| 国产精品久久久久久久久久东京| 91蜜桃视频在线观看| 欧美激情精品久久久| 精品人妻aV中文字幕乱码色欲| 麻豆精品视频| 在线视频中文字幕一区二区| 久久久久久国产精品无码| 欧美成人video| 丰满少妇高潮久久三区| 国产99久久久欧美黑人| 99热国产精品| 国产女主播自拍| 黄页视频在线91| 农民人伦一区二区三区| 亚洲成人精品视频在线观看| 伊人网av在线|