亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

AI圈水太深:OpenAI保密、Meta作弊!國產MoE卻異軍突起

IP屬地 中國·北京 編輯:楊凌霄 新智元 時間:2025-07-16 10:18:27


新智元報道

編輯:KingHZ

從GPT-2到Llama 4,大模型這幾年到底「胖」了多少?從百億級密集參數到稀疏MoE架構,從閉源霸權到開源反擊,meta、OpenAI、Mistral、DeepSeek……群雄割據,誰能稱王?

從傳統稠密架構到如今流行的稀疏專家模型(MoE),語言大模型發展突飛猛進:

最初參數量只有百億級別,而現在即便僅激活的參數,也已達數百億!

從百億到萬億,參數膨脹的背后,是AI界對Scaling Law的「信仰」。


自2019年GPT-2發布以來,大語言模型(LLM)在參數規模、訓練數據量和模型架構上不斷實現飛躍。

大模型到底有多大?從2019年到現在,大模型到底經歷了什么樣的「體重暴漲」?

Github網友rain-1手動總結了基礎模型趨勢,「不含任何AI生成成分」。他還表示:

近年來,語言模型波瀾壯闊,宏大深遠。

所記述的不過是其中一個微小片段,如同管中窺豹,可見一斑。


本文旨在客觀呈現大語言模型的規模信息。不涉及泄露信息或坊間傳聞,僅聚焦基礎模型(即原始文本續寫引擎,而非ChatBot)。


AI模型參數量呈指數級增長

大模型來時路之GPT系列

OpenAI走向「CloseAI」

主要分為2大階段:早期密集模型和中期轉型與保密期。

早期密集模型(2019-2020):

GPT-2家族:參數從137M到1.61B,訓練數據約10B tokens。

GPT-3(175B):首個真正意義上的「大模型」。

中期轉型與保密期(2022-2023):

GPT-3.5和GPT-4:未公布參數或數據規模,信息高度保密。

具體而言,GPT-2(2019年)參數規模:

GPT-2-small:1.37億參數

GPT-2-medium:3.8億參數

GPT-2-large:8.12億參數

GPT-2-xl:16.1億參數

訓練數據基于未公開的WebText數據集,約40GB互聯網文本,估計約100億token。

2020年,OpenAI發布GPT-3,代號davinci/davinci-002,參數規模為1750億(175.0B)。


鏈接:https://www.lesswrong.com/posts/3duR8CrvcHywrnhLo/how-does-gpt-3-spend-its-175b-parameters

訓練數據約4000億token,來源包括CommonCrawl、WebText2、Books1、Books2和Wikipedia。

具體數據來源信息,參考下列論文。


論文鏈接:https://arxiv.org/abs/2005.14165

GPT-3訓練耗時數月,動用了數萬塊A100GPU的數據中心算力。

2022-2023年,GPT-3.5&GPT-4官方未公開架構細節、訓練數據規模等信息。

之后。OpenAI一度成為高度保密的「黑箱」。而開源模型,特別是LLaMA家族「水漲船高」:

從7B到65B,其中65B使用1.4T tokens訓練;

LLaMA 3.1達到405B參數、3.67T tokens數據,是開源領域的一個轉折點。

大模型來時路之Llama系列

Llama初代版本規模7B、13B、33B、65B參數。

訓練數據方面,官方確認采用了Books3數據集。65B版本預訓練使用了1.4萬億(1.4T)token的數據集。


2024年,meta開源Llama-3.1 405B,參數規模高達4050億,采用密集Transformer架構(即推理時所有參數均參與計算)。

訓練數據方面,meta未詳細披露數據源,僅模糊表述為「來自多種知識來源的混合數據」,共消耗了3.67萬億token

初始預訓練:2.87萬億token

長上下文訓練:8000億token

退火訓練(Annealing):4000萬token


論文鏈接:https://arxiv.org/abs/2407.21783

他們還有項關鍵發現:

實驗表明,在核心基準測試中,對小規模高質量代碼和數學數據進行退火訓練(Annealing),可顯著提升預訓練模型的表現。

但網友本人對當前流行的「Benchmax退火預訓練」趨勢表示遺憾——

它使得基礎語言模型逐漸偏離了「初心」——純粹的文本續寫引擎定位。

這種優化本該屬于后訓練階段(即讓模型扮演「AI聊天助手」角色的過程),但企業顯然更看重benchmark分數的短期提升。

2025,meta推出Llama-4系列,其中2萬億參數巨獸「Behemoth」,或永不面世。


Llama4系列中的旗艦大模型Behemoth,是參數總量達2萬億的稀疏專家模型(MoE),架構為A288B 16E——即具備2880億激活參數、共計16個專家模塊,但尚未公開發布

Llama4的Maverick和Scout模型都是從這款大模型中蒸餾而來。然而,圍繞這些輕量版本,卻爆發了一場丑聞——

meta(原facebook)被曝在lmarena基準測試平臺上「作弊」


此舉被外界視為學術不端,嚴重打擊了外界對Llama團隊的信任。此后,,至今不明這款2T模型是否還有問世的可能。

至于已經發布的Llama4小模型,盡管打著「繼承大模型精華」的旗號,但目前普遍評價是:智能水平較低,難堪大用。

大模型荒原時代

曾經,AI界一度陷入「大模型荒原」——其他模型無法與GPT-3匹敵。

大家只能反復微調LLaMA等小模型,試圖追趕GPT-3留下的龐大身影。

但這種「用AI訓練AI」的做法,也讓模型性能陷入惡性循環。

Llama 405B模型的發布堪稱轉折點。在此之前,Mistral發布了2款混合專家模型:

2023年12月,推出Mixtral 8x7B(混合專家模型)。

2024年4月,升級發布Mixtral-8x22B(總參數量141B,實際激活參數39B的稀疏混合專家模型)。

Mixtral-8x22B盡管不是GPT-3那樣的密集模型,但總參數量級已與GPT-3(175B)相當。


混合專家MoE架構的革命性在于,它讓普通研究者也能訓練和使用超大規模的模型——不再需要動用成千上萬張GPU組成的計算集群。

2023末,稀疏MoE架構的興起:Deepseek V3等接踵而來。

在參數總量遠超GPT-3的同時,MoE模型激活參數維持在幾十B級別,從而降低推理成本。

這些LLM支持多語言、多模態,并采用更大上下文窗口(32K~256K tokens)。有的新模型還采用「退火」式后訓練,提升特定基準測試上的表現。

MoE熱潮來襲

群雄并起,誰主沉浮?

2024年圣誕節次日,DeepSeek發布了震撼之作——V3 base。官網如此描述:

V3新特性

6710億MoE參數

370億激活參數

基于14.8萬億高質量token訓練


這不僅實現了模型規模的巨大飛躍,衍生的R1推理模型更讓業界驚艷——

R1可能是首個真正達到GPT-4水平,而且可自由下載使用的模型。

稀疏的不是能力,是讓計算更精準地對焦。

此次突破掀起了MoE大模型的訓練熱潮,尤其在中國市場。值得注意的是,這些新模型普遍具備多模態、多語言能力,訓練數據維度大幅拓展。

代表性模型巡禮

1.Databricks DBRX(2024年3月)

架構:1320億總參/360億激活/12萬億token訓練

創新點:采用16選4的細粒度專家系統(相較Mixtral-8x7B的8選2架構更精細)


2.Minimax-Text-01(2025年1月)

架構:4560億總參/459億激活

特色:創新性融合注意力機制與MoE架構

質量控制:采用前代60億參數MoE模型進行數據標注

3.Dots.llm1(2025年6月)

亮點:128選6超細粒度專家系統+2個常駐專家

成就:不使用合成數據即達到Qwen2.5-72B水平

技術:引入QK-Norm注意力層優化

4.混元(2025年6月)

突破:20萬億token訓練/256K上下文窗口

架構:8專家動態激活+1個常駐共享專家

5.文心4.5(2025年6月)

規模:4240億總參/470億激活

特點:多模態基座模型

訓練:基于「數萬億」token(具體數據未披露)


尾聲

未來在哪里?

在很長一段時間內,市面上幾乎沒有與GPT-3規模相同的LLM可供使用。

由于缺乏可下載的同等級模型,人們很難復現GPT-3的性能。

而且坦率地說,人們當時并沒有真正意識到:要想要達到GPT-3的表現,模型的規模必須接近1750億參數。

當時能拿來用的,最多也只是LLaMA系列中參數不超過700億的模型,大家也只能靠這些湊合著用。

而目前,網友rain所知的最新、最大的可用稠密基礎模型有4050億參數。在預訓練中,它使用了更近時段的數據(包括人們討論大語言模型、分享模型對話記錄的內容),而且模型本身也經過「退火」(annealing)處理。

因此相比以往那些基礎模型,它更像已經初步具備助手特性的系統。

最近一批稀疏專家模型(MoE)也有類似的問題,并且這些模型在訓練數據中還融入了一些中文文化元素。

要怎么公平地比較稀疏模型(MoE)和致密模型,目前還沒有明確標準。


也許大語言模型的一些高級能力,只有在模型足夠深、結構足夠密集時才會顯現出來。而現有的自動評測指標,可能并不能很好地捕捉這些能力。所以現在很多人索性一頭扎進了MoE模型的研發中。

一些新模型也在嘗試采用新的網絡架構(比如RWKV、byte-latent、bitnet)或者使用合成數據生成的新方法。

不過,要打造一個優秀的文本生成引擎,目前還不清楚這些新技術到底有多大幫助。

網友rain說得直接:文本生成引擎才是一切的基礎。

沒有優秀的文本續寫能力,后續的微調、角色扮演都只是空中樓閣。

在「助手化」狂潮之外,也許是時候重新思考——

我們真的理解基礎模型的本質了嗎?

參考資料:

https://gist.github.com/rain-1/cf0419958250d15893d8873682492c3e


免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

人人爽香蕉精品| 午夜偷拍福利视频| 国产精品色哟哟| 26uuu国产精品视频| 精品国产午夜福利在线观看| 国产精品久久久久久久久免费相片| 日韩欧美在线网站| 精品少妇一二三区| 欧美国产日韩一区二区| 久久综合综合久久| 911国产精品| 人妻av无码专区| 奇米在线7777在线精品| 国产精品亚洲精品| 中文字幕永久有效| 国产喷水吹潮视频www| 亚洲国产一区二区三区青草影视| 97视频在线观看免费高清完整版在线观看| 日本中文在线播放| 亚洲成人精品久久久| 成年人在线观看视频免费| 亚洲天天做日日做天天谢日日欢 | 国产日韩精品综合网站| 福利电影一区二区三区| wwwwww欧美| 亚洲成av人片www| 香港三级韩国三级日本三级| 99久久777色| 免费在线观看一区二区| 日本色综合中文字幕| 国产精品免费一区二区三区四区| 欧美成人综合色| 欧美一区二区三区性视频| 337人体粉嫩噜噜噜| 精品一区二区三区三区| 国产精品成人在线视频| 欧美精品一区视频| 牛人盗摄一区二区三区视频| 成人午夜视频福利| 欧美二级三级| 成人免费一区二区三区视频| 99久久国产宗和精品1上映| 国产亚洲精品bt天堂精选| 国产日韩欧美在线视频观看| 麻豆成人免费视频| 中文字幕亚洲综合| 岛国av免费在线| 国产精品第一页第二页第三页| 国产三级国产精品| 日韩中文有码在线视频| 国产suv精品一区二区68| 精品国产99国产精品| 又黄又爽的网站| 一区二区三区在线视频免费观看| 国产黄色激情视频| 精品婷婷伊人一区三区三| 国产精品乱子伦| 成人在线中文字幕| 亚洲AV第二区国产精品| 国产精品久久久久av| 国产绿帽一区二区三区| 国产精品露脸自拍| 无码人妻aⅴ一区二区三区有奶水| 色视频欧美一区二区三区| 日韩大片一区二区| 亚洲免费人成在线视频观看| 日韩精品欧美精品| 欧美一区二区三区四区在线观看地址 | 久久精品中文字幕一区二区三区| 97精品久久久午夜一区二区三区| 亚洲一区二区三区蜜桃| 亚洲aaa激情| 欧美亚一区二区| 日韩精品――中文字幕| 久久天天躁狠狠躁夜夜av| 免费看一级一片| 中文字幕亚洲专区| 少妇喷水在线观看| www.成人av.com| 激情深爱一区二区| 日韩偷拍一区二区| 日本人妖一区二区| 欧美精品videos另类日本| 中文字幕欧美日韩一区二区| 天堂免费在线视频| 色狠狠久久av五月综合| 懂色av中文一区二区三区天美| 日韩免费视频网站| 日韩福利二区| 精品国产三级电影在线观看| 国产真实乱偷精品视频免| 免费人成视频在线播放| 日韩美女写真福利在线观看| 日韩毛片精品高清免费| 日韩黄色在线播放| 蜜桃麻豆www久久国产精品| 亚洲综合激情小说| 久久国产高清视频| 国产成人精品电影| 亚洲欧美在线aaa| 日韩一区二区三区四区视频| 国产欧美一区二区三区在线| 中文字幕在线免费不卡| 精品人伦一区二区三电影 | 欧美三级视频在线| 免费一级suv好看的国产网站| 欧美一性一乱一交一视频| 国产亚洲欧美日韩日本| 最近中文字幕在线观看| 乱子伦视频在线看| 99国产在线观看| 欧美成人综合网站| 国产在线看一区| 欧美日韩国产黄色| 国产九色精品| 亚洲午夜免费福利视频| 私库av在线播放| 欧美极品视频一区二区三区| 欧美性猛交xxxx免费看久久久| 毛片基地在线观看| 国产精品狠色婷| 美女精品自拍一二三四| 国产淫片av片久久久久久| 国模吧一区二区| 亚洲一区在线观看网站| 日韩av在线看免费观看| 欧美综合激情网| 亚洲精品欧美专区| 中文字幕人妻熟女人妻洋洋| 国产视频精品免费播放| 一级片在线免费观看视频| 美女黄色片网站| 日韩一区二区欧美| 91免费在线播放| 欧美xxxx黑人| 日韩中文字幕网站| 老司机精品视频一区二区三区| 日韩精品久久一区二区| 精品久久在线播放| 黄色片网站免费| 欧美自拍视频在线| 色欧美乱欧美15图片| 久久久www| 国产免费视频传媒| 亚洲美女中文字幕| 高清视频一区二区| 成人小视频在线观看免费| 日韩视频免费观看高清完整版 | 日韩精品在在线一区二区中文| 无码人妻丰满熟妇区五十路百度| 黄色片子在线观看| 久久亚洲欧美| 亚洲无线码一区二区三区| 中文字幕av一区二区| 国内精品二区| 亚洲欧美日韩一二三区| 久久精品视频1| 成人一区二区三区中文字幕| 欧美日韩一级视频| 欧美在线视频在线播放完整版免费观看| 综合色婷婷一区二区亚洲欧美国产| 国产毛片毛片毛片毛片毛片毛片| 国产精品久久久久久免费播放| 国产婷婷色一区二区三区在线| 亚洲精品在线三区| 亚洲一区二区少妇| 久久久久久久久久一区| 台湾佬中文在线| 国产宾馆实践打屁股91| 制服丝袜亚洲精品中文字幕| 国产精品女人久久久久久| 动漫av网站免费观看| 国产精品99精品| 懂色av噜噜一区二区三区av| 欧美一区二区三区喷汁尤物| 国产精品91免费在线| 丰满爆乳一区二区三区| 中文字幕在线字幕中文| 99re6这里只有精品视频在线观看| 日韩视频免费直播| 高清av免费一区中文字幕| 免费不卡av网站| 国产精品伦理一区| 亚洲欧美乱综合| 久久精品国产亚洲| 亚洲欧美日韩在线综合| 久久视频精品在线观看| 蜜臀av一区二区在线观看| 在线看日本不卡| 国产精品久久二区| 日韩爱爱小视频| 亚洲一区二区天堂| 综合在线观看色| 欧美另类精品xxxx孕妇| 日本人妻伦在线中文字幕| 日本不卡一区视频| 国产精品白丝av| 亚洲精品一区二区三区在线观看| 国产在线精品日韩| 国产精品三级在线观看无码| 免费在线一区观看| 欧美精选一区二区| 古典武侠综合av第一页| 日韩片在线观看| 人妖欧美一区二区| 7878成人国产在线观看| 成人性色av| 欧美性xxxx图片| 久久成人18免费观看| 日韩欧美视频在线| 精品综合久久久| 91社区视频在线观看| 丁香五精品蜜臀久久久久99网站| 精品视频在线播放| 亚洲欧美日韩精品在线| 黄色三级视频在线播放| 国产a级片网站| 久久精品久久国产| 久久蜜桃av一区二区天堂 | 久久偷看各类女兵18女厕嘘嘘 | 欧美疯狂性受xxxxx另类| 亚洲石原莉奈一区二区在线观看| 日韩中文一区| 成年人二级毛片| 成人短视频下载| 国产一区二区精品丝袜| 色婷婷777777仙踪林| 亚洲伊人成人网| 亚洲精品国产成人久久av盗摄 | 中文av一区二区三区| 国产99视频在线| 欧美自拍丝袜亚洲| 国产精品乱子乱xxxx| 91精品国产综合久久香蕉922| 久久久久无码国产精品一区李宗瑞| 日本不卡一区二区| 亚洲成人三级在线| 亚洲人成人77777线观看| 国产污视频在线观看| 亚洲视频香蕉人妖| 国产999在线观看| 一级黄色免费视频| 国内外成人在线| 亚洲欧洲一区二区三区在线观看| 国产一区二区三区在线免费| 最新国产中文字幕| 亚洲午夜羞羞片| 成人在线视频网| 亚洲女人毛茸茸高潮| 久久久久99精品一区| 国产69精品久久久久99| 国产欧美精品一二三| 久久精品国产一区二区三| 亚洲天堂男人天堂女人天堂| 国产精品久久中文字幕| 成人福利小视频| 日韩欧美综合一区| 男女啪啪的视频| 伊人成人在线观看| 欧美三级韩国三级日本一级| 欧洲亚洲一区| 香蕉影院在线观看| 欧美性高潮床叫视频| 国产亚洲一区在线播放| 久久久久久久黄色| 一区二区成人在线观看| 97伦理在线四区| 欧美成人精品欧美一级私黄| 亚洲精品成人a在线观看| 91久久在线视频| 黑鬼狂亚洲人videos| 国产精品进线69影院| 国产精品丝袜视频| 亚洲综合图片一区| 亚洲精品乱码久久久久久| 91网站免费看| 青娱乐国产在线视频| 亚洲一区二区三区四区在线免费观看| 91精品国产一区二区三区动漫| www.毛片com| 亚洲国产视频在线| 国产精品久久毛片av大全日韩| 日韩欧美国产综合| 亚洲色图都市激情| 亚洲黄色小说网| 亚洲精品ady| 免费观看日韩毛片| 日韩专区一卡二卡| 色七七影院综合| 亚洲制服在线观看| 成人午夜大片免费观看| 海角国产乱辈乱精品视频| 成人在线视频免费播放| 久久久99精品久久| 国产精品一区电影| 亚洲av鲁丝一区二区三区| 婷婷成人综合网| 四虎影视永久免费在线观看一区二区三区| 中文字幕日产av| 日韩精品一区二区三区蜜臀| 成人免费观看cn| 日韩成人av影视| 久久亚洲影音av资源网 | 精品乱码亚洲一区二区不卡| 欧美精品自拍视频| 日本欧美一区二区在线观看| 久久五月天综合| 亚洲久久久久久| 国产精品国产精品国产专区不片| 99se婷婷在线视频观看| 天天干天天干天天操| 欧美一区二区三区四区久久| 成人综合视频在线| 国产毛片一区二区| 国精产品一区一区三区有限在线| 女人十八毛片嫩草av| 亚洲国产一区二区视频| 亚洲国产精品久久久久久女王| 不卡视频免费在线观看| 一区二区三区亚洲| 亚洲av无码专区在线播放中文| 国产精品三级视频| 成人区精品一区二区| 中文字幕精品无码亚| 日韩成人xxxx| 特黄特黄一级片| 国产精品午夜电影| 国产一区国产精品| 国产美女裸体无遮挡免费视频| 亚洲欧美日韩在线高清直播| 伊人影院在线观看视频| 精品国产依人香蕉在线精品| 精品视频高清无人区区二区三区| 欧美一级黄视频| 精品久久国产老人久久综合| 久久久精品三级| 99久久久久免费精品国产| 成人精品网站在线观看| 日本视频网站在线观看| 欧美r级在线观看| 88av.com| 久久久天堂av| 国严精品久久久久久亚洲影视| 国产又粗又黄视频| 一区二区三区无码高清视频| 国产激情视频网站| 亚洲国产日韩a在线播放| 尤物国产精品| 免费视频一区二区| 欧美主播福利视频| 日本一级一片免费视频| 欧美成人a在线| xxx中文字幕| 亚洲女同ⅹxx女同tv| 一区二区免费电影| 九一久久久久久| 国产日产欧美a一级在线| 波多野结衣黄色网址| 亚洲偷熟乱区亚洲香蕉av| 国产三级国产精品| 日韩欧美在线观看| 亚洲爆乳无码专区| 国产午夜久久久久| 青青草原成人| 美女视频黄免费的久久| 清纯唯美亚洲激情| 99久久久久久久久| 在线日韩中文字幕| 美女av免费看| 日韩午夜中文字幕| 在线观看一区二区三区四区| 亚洲电影一区二区| a√天堂在线观看| 欧美韩国日本不卡| 综合色婷婷一区二区亚洲欧美国产| 国内精品免费在线观看| 亚洲自拍中文字幕| 亚洲毛片在线播放| 欧美在线一级va免费观看| 中文字幕在线看人| 日韩视频亚洲视频| 免费在线观看av网址| 日韩av影院在线观看| 美女脱光内衣内裤| 91 com成人网| 亚洲男女在线观看| 欧亚一区二区三区| 色婷婷一区二区三区在线观看| 亚洲一区二区欧美| 东京热加勒比无码少妇| 中文字幕在线一区免费| 999久久欧美人妻一区二区| 久久亚洲影视婷婷| 一区二区免费在线观看| av电影天堂一区二区在线| 青青影院一区二区三区四区| 国产一区欧美日韩| 国产一区免费在线| 久久99精品久久久久久久久久久久| 成人欧美一区二区三区在线| 欧美在线 | 亚洲| 国产精品久在线观看| av中文字幕播放| 国产精品扒开腿做爽爽爽的视频| 国产精品国产一区二区三区四区 | 色婷婷精品大在线视频| 中文字幕免费高清在线| 精品成人乱色一区二区| 五月激情五月婷婷| 一本大道久久a久久精品综合|