亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁 ? 資訊 ? 新科技 ? 正文

只用512張H200!106B模型靠分布式RL殺出重圍,全網(wǎng)開源

IP屬地 中國·北京 新智元 時間:2025-12-10 14:21:47


新智元報(bào)道

編輯:元宇

Prime Intellect發(fā)布的INTELLECT-3,在數(shù)學(xué)、代碼等多項(xiàng)基準(zhǔn)測試中取得同規(guī)模最強(qiáng)表現(xiàn)。該模型旨在將訓(xùn)練前沿模型的技術(shù)棧開放給社區(qū),推動大規(guī)模RL研究的普及與發(fā)展。

最近,Prime Intellect正式發(fā)布了INTELLECT-3。

這是一款擁有106B參數(shù)的混合專家(Mixture-of-Experts)模型,基于Prime Intellect的強(qiáng)化學(xué)習(xí)(RL)技術(shù)棧訓(xùn)練。

在數(shù)學(xué)、代碼、科學(xué)與推理的各類基準(zhǔn)測試上,它達(dá)成了同規(guī)模中最強(qiáng)的成績,甚至超越了不少更大的前沿模型。

Prime Intellect已經(jīng)把完整的訓(xùn)練流程——包括模型權(quán)重、訓(xùn)練框架、數(shù)據(jù)集、RL環(huán)境和評測體系——全部開源,希望能推動更多關(guān)于大規(guī)模強(qiáng)化學(xué)習(xí)的開放研究。

INTELLECT-3使用的訓(xùn)練軟件與基礎(chǔ)設(shè)施,與即將在Prime Intellect平臺向所有人開放的版本完全一致。

這意味著未來每個人、每家公司都能擁有對最先進(jìn)模型進(jìn)行后訓(xùn)練的能力。

多項(xiàng)基準(zhǔn),斬獲SOTA

INTELLECT-3是一個106B參數(shù)的Mixture-of-Experts(MoE)模型,基于GLM 4.5 Air進(jìn)行了監(jiān)督微調(diào)(SFT)和強(qiáng)化學(xué)習(xí)訓(xùn)練。

它在數(shù)學(xué)、代碼、科學(xué)和推理類Benchmark上均取得了同體量中的最強(qiáng)表現(xiàn)。


訓(xùn)練框架

訓(xùn)練中,Prime Intellect使用了以下核心組件:

PRIME-RL:自研的分布式RL框架,支持監(jiān)督微調(diào)和大規(guī)模MoE模型的強(qiáng)化學(xué)習(xí)。

Verifiers 與 Environments Hub:統(tǒng)一的環(huán)境接口與生態(tài),用于各類智能體式RL環(huán)境與評測。

Prime Sandboxes:高吞吐、安全的代碼執(zhí)行系統(tǒng),用于智能體代碼類環(huán)境。

算力編排:在64個互聯(lián)節(jié)點(diǎn)上的512張NVIDIA H200 GPU完成調(diào)度與管理。

INTELLECT-3完整使用PRIME-RL進(jìn)行端到端訓(xùn)練。

這套框架與Verifiers環(huán)境深度整合,支撐從合成數(shù)據(jù)生成、監(jiān)督微調(diào)、強(qiáng)化學(xué)習(xí)到評估的整個后訓(xùn)練體系。

通過與Environments Hub的緊密連接,訓(xùn)練系統(tǒng)可以順暢訪問不斷擴(kuò)展的環(huán)境與評測任務(wù)集合。

PRIME-RL最顯著的特點(diǎn)是全分布式(async-only)。

研究團(tuán)隊(duì)在上一代INTELLECT-2時就已經(jīng)確認(rèn):

RL的未來一定是分布式的,也就是始終處于輕微off-policy的狀態(tài)。

因?yàn)樵陂L時序智能體rollout中,分布式是唯一能避免速度瓶頸、真正擴(kuò)大訓(xùn)練規(guī)模的方式。


過去6個月,研究團(tuán)隊(duì)重點(diǎn)做了大量關(guān)于性能、穩(wěn)定性和大規(guī)模效率的消融實(shí)驗(yàn),INTELLECT-3正是這些研究的成果。

Prime Intellect也將在即將上線的Lab平臺提供托管式PRIME-RL,訪問者無需處理復(fù)雜基礎(chǔ)設(shè)施就能進(jìn)行大規(guī)模RL訓(xùn)練。

訓(xùn)練環(huán)境

INTELLECT-3的訓(xùn)練環(huán)境由Verifiers庫構(gòu)建,并托管于Environments Hub,這是Prime Intellect面向社區(qū)的RL環(huán)境與評測中心。

Verifiers是當(dāng)前領(lǐng)先的開源工具,用來為模型構(gòu)建RL環(huán)境與評測任務(wù)。

它提供模塊化、可擴(kuò)展的組件,讓復(fù)雜環(huán)境邏輯也能以簡潔方式描述,同時保持極高性能與吞吐。

傳統(tǒng)的RL框架通常把環(huán)境強(qiáng)綁定在訓(xùn)練倉庫里,使得版本管理、消融與外部貢獻(xiàn)都不方便。

Environments Hub則把基于Verifiers的環(huán)境作為獨(dú)立、可鎖定版本的Python模塊發(fā)布,并統(tǒng)一入口點(diǎn),讓任務(wù)可以獨(dú)立版本化、共享與持續(xù)迭代。


INTELLECT-3使用的所有環(huán)境和評測,均已公開在Environments Hub。

為了支持強(qiáng)化學(xué)習(xí),Prime Intellect大幅擴(kuò)展并升級了自研的Sandboxes基礎(chǔ)設(shè)施。

在幾千條并發(fā)rollout中安全執(zhí)行外部代碼,需要一個具備亞秒級啟動、毫秒級執(zhí)行延遲的容器編排層。

雖然Kubernetes提供了底層能力,但常規(guī)架構(gòu)并無法滿足這種高速度的訓(xùn)練需求。

Prime Sandboxes可以繞過Kubernetes控制面板,通過Rust直接與pod通信,做到接近本地進(jìn)程的延遲;即使在大規(guī)模并發(fā)下也能在10秒內(nèi)啟動,且每個節(jié)點(diǎn)可穩(wěn)定運(yùn)行數(shù)百個隔離沙箱。

在Verifiers中,研究人員將沙箱啟動與模型首輪推理并行,從而完全消除代碼執(zhí)行前的可感知等待時間。

算力調(diào)度

研究人員在64個互聯(lián)節(jié)點(diǎn)上部署了512張NVIDIA H200 GPU。

最大工程挑戰(zhàn)是如何在可能出現(xiàn)硬件故障的分布式系統(tǒng)里保持確定性與同步。

資源準(zhǔn)備:使用Ansible做基礎(chǔ)設(shè)施即代碼、自動發(fā)現(xiàn)硬件,并進(jìn)行InfiniBand預(yù)檢以隔離慢節(jié)點(diǎn)或故障節(jié)點(diǎn)。

調(diào)度:通過Slurm + cgroup v2確保任務(wù)可以干凈退出,不會留下占用GPU顯存的殘留進(jìn)程。

存儲:用Lustre提供高吞吐訓(xùn)練I/O,用NVMe NFS作為快速元數(shù)據(jù)與便捷SSH存儲。

可觀測性:通過DCGM + Prometheus監(jiān)控,能在問題擴(kuò)大前快速發(fā)現(xiàn)并下線不穩(wěn)定節(jié)點(diǎn)。

訓(xùn)練方案

INTELLECT-3主要分兩階段:

基于GLM-4.5-Air的監(jiān)督微調(diào),以及大規(guī)模RL訓(xùn)練。

兩個階段以及多輪消融實(shí)驗(yàn)都在512張H200 GPU上運(yùn)行,總共持續(xù)兩個月。

研究人員訓(xùn)練了覆蓋數(shù)學(xué)、代碼、科學(xué)、邏輯、深度研究、軟件工程等類別的多樣化RL環(huán)境,用來提升模型的推理與智能體能力。

所有環(huán)境均已在Environments Hub上公開。


所有基準(zhǔn)測試也都提供了標(biāo)準(zhǔn)化且驗(yàn)證過的實(shí)現(xiàn)。

未來,Prime Intellect的工作重點(diǎn)包括:

擴(kuò)展智能體式RL:研究人員將繼續(xù)訓(xùn)練,并更強(qiáng)調(diào)智能體環(huán)境,預(yù)計(jì)能在更多任務(wù)上獲得進(jìn)一步提升。

更豐富的RL環(huán)境:Environments Hub已擁有 500+ 任務(wù),涵蓋研究、電腦使用、定理證明、自動化和專業(yè)領(lǐng)域。INTELLECT-3 只用到了其中一小部分,下一步是讓RL覆蓋更多、更高質(zhì)量的社區(qū)任務(wù)。

長時序智能體:研究人員正在讓模型能夠自我管理上下文(如裁剪上下文、分支推理、維護(hù)輕量外部記憶),從而讓長時序行為真正可通過RL訓(xùn)練。未來也會探索專門獎勵長時序推理的環(huán)境。

Prime Intellect正在構(gòu)建開放的超級智能技術(shù)棧,把訓(xùn)練前沿模型的能力交到每個人手里。

INTELLECT-3 也證明:即使不是大實(shí)驗(yàn)室,也可以訓(xùn)練出與頂尖團(tuán)隊(duì)同臺競技的模型。

參考資料:

https://www.primeintellect.ai/blog/intellect-3

秒追ASI

?點(diǎn)贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點(diǎn)亮星標(biāo),鎖定新智元極速推送!

免責(zé)聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

全站最新
手机在线观看免费av| 国产视色精品亚洲一区二区| 亚洲黄色在线播放| 国产亚洲欧美一区二区| 99久久久久免费精品国产| 色视频一区二区三区| 欧美国产精品一区二区三区| 岛国av免费在线| 精品国精品自拍自在线| 天堂а√在线中文在线新版| 国产欧美久久久久久| 国产老妇另类xxxxx| 日本阿v视频在线观看| 亚洲国产wwwccc36天堂| 北岛玲一区二区| 中文字幕av一区二区三区谷原希美| 亚洲无码精品国产| 久久精品第九区免费观看| 中文字幕在线观看不卡视频| 亚洲激情 欧美| 日韩在线观看免费网站| 蜜桃视频污在线观看| 一区精品在线| 欧美性猛片aaaaaaa做受| 日韩女优一区二区| 国产玖玖精品视频| 国产欧美一区二区精品仙草咪| 在线免费黄色小视频| 一本一本久久a久久精品牛牛影视| 国产日韩精品suv| 亚欧精品在线| 91精品办公室少妇高潮对白| 欧美日韩中文字幕在线观看| 成人网中文字幕| 国产精品久久久久久久浪潮网站 | 国产高清精品软男同| 精品久久久免费| 久久久久久免费观看| 亚洲一区二区三区sesese| 日本一区二区三区dvd视频在线| 色哟哟无码精品一区二区三区| 日韩中文字幕在线播放| 日韩高清在线一区| 日韩久久一级片| 亚洲免费av网址| 日韩**一区毛片| 无码人妻丰满熟妇区毛片18| 亚洲女人天堂网| 日韩精品1区2区3区| 波多野结衣作品集| 中文字幕自拍vr一区二区三区| 日韩精品久久理论片| 国产视频手机在线播放| 最近中文字幕日韩精品| 激情久久五月天| 999在线精品视频| 色综合视频一区中文字幕| 高清国产午夜精品久久久久久| 欧美日韩一区二区区别是什么 | 国产91在线亚洲| 精品免费一区二区三区| 亚洲精品成av人片天堂无码| 免费一级特黄毛片| 亚洲男人第一av网站| 六月丁香综合在线视频| 善良的小姨在线| 国内精品久久久久伊人av| 99精品视频一区二区三区| 人妻无码一区二区三区| 国产精品一二三视频| 一区二区三区欧美亚洲| 在线能看的av| 国产精品免费看久久久无码| 精品亚洲一区二区三区在线播放 | 婷婷伊人综合中文字幕| 男女污污的视频| 欧美国产精品人人做人人爱| 国产亚洲欧美在线| 精品肉丝脚一区二区三区| 亚洲精品美女久久7777777| 亚洲成成品网站| 久久午夜电影| 日本少妇激三级做爰在线| 97在线看免费观看视频在线观看| 国产色婷婷亚洲99精品小说| 午夜偷拍福利视频| 国产免费xxx| 中文一区二区视频| 2021国产精品久久精品| 欧美日韩一级在线观看| 中文字幕人成一区| 中文字幕日韩电影| 久久精品人人做| www.天天色| 成年人视频网站免费| 中文字幕亚洲无线码a| 91老师国产黑色丝袜在线| 午夜爽爽爽男女免费观看| 日本一区二区三区视频在线播放| 亚洲成色777777在线观看影院| 国产综合成人久久大片91| 在线免费观看麻豆| 牛人盗摄一区二区三区视频| 亚洲国产精品一区二区三区| 成人视屏免费看| 免费又黄又爽又色的视频| 99re8这里只有精品| 久久视频免费在线播放| 亚洲欧美一区二区三区久本道91 | 亚洲奶汁xxxx哺乳期| 日韩精品在线播放视频| 96国产粉嫩美女| 日韩午夜在线观看| www.一区二区| 亚州国产精品视频| www.欧美日本| 91亚洲va在线va天堂va国| 日韩欧美在线影院| 97aⅴ精品视频一二三区| 在线观看黄网站| 尤蜜粉嫩av国产一区二区三区| 国产精品爽黄69天堂a| 欧美一区二区人人喊爽| 成人av电影免费观看| 一级免费在线观看| 色综合手机在线| 亚洲www在线| 亚洲国产精品女人久久久| 久久久久久黄色| 亚洲视频 欧美视频| 国产aⅴ爽av久久久久| 99精品国产高清在线观看| 精品视频在线观看日韩| 国产精品久久久久桃色tv| 亚洲xxx在线| 欧美老女人性生活视频| 少妇久久久久久被弄到高潮| 欧美重口另类videos人妖| 欧美人与禽zozo性伦| av电影天堂一区二区在线观看| 东京热一区二区三区四区| 天天看片天天操| 久久国产日韩欧美| 欧美大胆在线视频| 欧美在线999| 99久久婷婷国产综合精品电影| 久久人人爽人人爽人人片av免费| 激情久久综合网| 欧美影视一区二区| 欧美国产日韩一区| 欧美精品123区| 国产三级欧美三级| 色呦呦免费观看| 三级黄色在线观看| 国产原创精品在线| 四虎影视永久免费在线观看一区二区三区 | 水蜜桃色314在线观看| 国产中文字幕91| 在线观看国产精品91| 精品久久久一区二区| 国产v综合v亚洲欧| 伊人成年综合网| 天天躁夜夜躁狠狠是什么心态| 国产美女网站在线观看| 国产自产在线视频一区| 久久久久久久一区二区三区| 日韩免费一区二区| 亚洲一区二区在线免费看| 国产成人综合在线| www国产一区| 久久综合亚洲色hezyo国产| 国产精品99久久久精品无码| 波多野结衣激情| 91精品国产99久久久久久红楼| 久久av中文字幕| 欧美电视剧在线看免费| 亚洲二区在线视频| 久久综合视频网| 奇米精品一区二区三区四区| 中文字幕欧美人妻精品一区蜜臀| www.涩涩爱| 国产精品igao网网址不卡| 福利在线小视频| 成人资源视频网站免费| 性色av一区二区咪爱| 亚洲欧美国产一区二区三区| 欧美午夜电影在线播放| 亚洲女同ⅹxx女同tv| av不卡在线播放| 日本视频一区二区三区| 国产乱叫456在线| 日本少妇激情舌吻| 男人操女人动态图| www.污网站| 国产最新免费视频| 日本一区视频在线| ts人妖另类在线| 国产精品你懂得| 久久久欧美精品| 中文字幕亚洲一区在线观看| 日韩精品一区二区三区在线| 精品久久久精品| 亚洲欧美另类小说| 国产亚洲视频系列| 99精品一区二区| 国产又黄又大久久| 视频一区二区国产| 亚洲va久久久噜噜噜无码久久| 自拍偷拍福利视频| 国产成人免费观看视频| 91在线播放观看| 亚洲天堂岛国片| 日本少妇xxxx| 第一页在线视频| 不用播放器的免费av| 九九视频精品在线观看| 国产精品av免费观看| 亚洲午夜精品福利| 视频一区二区在线| 免费日韩av电影| 国产精品.com| 懂色av一区二区三区在线播放| 国产精品久久久久久久久久久新郎 | 国产偷国产偷亚洲高清97cao| 91视频国产精品| 成人xvideos免费视频| 久久久欧美一区二区| 久久91亚洲精品中文字幕| 久久精品国产一区二区电影| 中文字幕日韩欧美在线视频| 亚洲日韩中文字幕在线播放| 日韩精品中文字幕有码专区 | 久久久91精品国产一区二区精品| av在线这里只有精品| av一区二区三区黑人| 99久久精品国产导航| 久久久天堂av| 日本一区二区三区高清不卡| 国产精品麻豆久久久| 亚洲同性同志一二三专区| 日韩一区有码在线| 亚洲黄色在线视频| 亚洲动漫第一页| 欧美性猛交xxx| 在线观看网站黄不卡| 欧美性一二三区| 69堂国产成人免费视频| 日韩一区二区在线免费观看| 精品久久人人做人人爰| 亚洲美女久久久| xxxx性欧美| 午夜精品久久久久久久白皮肤| 欧美综合一区第一页| 国产欧美最新羞羞视频在线观看| 91麻豆桃色免费看| 国内外成人免费视频| 视频一区视频二区视频三区高| 杨幂一区欧美专区| 69sex久久精品国产麻豆| 国产精品亚洲αv天堂无码| 男人女人黄一级| 中文字幕avav| 亚洲a v网站| 麻豆亚洲av熟女国产一区二| 一级一片免费看| 亚洲卡一卡二卡三| 韩国精品久久久| 99re成人在线| 亚洲精品高清在线| 91福利国产精品| www.毛片com| 亚洲色图欧美制服丝袜另类第一页| 国产精品无码白浆高潮| 久久久久久久久久久久久国产| 在线不卡一区二区| 人与动物性xxxx| 91精选在线观看| 国产一区二区三区四区五区六区| 成人av高清在线| 亚洲精品欧美日韩| 欧美一级淫片免费视频魅影视频| 久久在线免费观看视频| 免费黄色在线网址| 国内精品视频一区| 中文字幕人妻色偷偷久久| 亚洲影视九九影院在线观看| 亚洲a视频在线观看| 国产精品九九九| 亚洲AV无码成人精品区明星换面| 亚洲精选视频在线| julia一区二区中文久久94| 国产精品无码粉嫩小泬| 不卡日韩av| 中文欧美字幕免费| 一区二区三区在线观看免费视频| 日本欧美中文字幕| 国产偷国产偷精品高清尤物| 希岛爱理中文字幕| 51精品国产人成在线观看| 欧美日韩亚洲精品一区二区三区| 日韩视频在线观看一区| 中文字幕剧情在线观看一区| 欧美一级生活片| 91久久久久久久久久久久| 亚洲 欧洲 日韩| 欧美肥妇毛茸茸| 国产精品乱码一区二区| 亚洲第一视频在线观看| 日本中文在线视频| 亚洲天堂视频在线播放| 琪琪一区二区三区| 久久女同精品一区二区| 在线观看不卡视频| 中文字幕亚洲一区| 成人做爰www免费看视频网站| 久久影视电视剧免费网站| 99精品国产99久久久久久97| 精品日产一区2区三区黄免费 | 91精品人妻一区二区三区蜜桃2| 国产精品毛片a∨一区二区三区| 欧美国产日韩激情| 国产东北露脸精品视频| 狠狠色综合欧美激情| 亚洲精品久久久久久国产精华液| 久久久久久久久久久影视| 日韩一二三在线视频播| 久久精品系列| 女同性恋一区二区| 一区二区三区中文在线观看| 800av在线播放| 亚洲免费av网址| 一区二区三区www污污污网站| 7777精品伊人久久久大香线蕉超级流畅 | 国产成人啪免费观看软件| 午夜一区二区三区视频| 亚洲一级免费视频| 亚洲影院色无极综合| 国产一区二区在线视频播放| 中文字幕精品亚洲| 少妇高潮久久久| 成人欧美一区二区三区小说| 亚洲精品狠狠操| 亚洲www永久成人夜色| 777米奇影视第四色| 免费一级肉体全黄毛片| 激情小说亚洲一区| 一本色道亚洲精品aⅴ| 欧美俄罗斯性视频| 亚洲亚洲精品三区日韩精品在线视频| 亚洲一区和二区| 一级片免费网站| 国产精品美女久久福利网站| 亚洲美女av网站| 精品一区二区国产| 欧美熟妇另类久久久久久多毛| 国产69精品久久久久久久久久| 国产精品一卡二卡在线观看| 欧美无人高清视频在线观看| 欧美一区二区.| 少妇高潮喷水在线观看| 免看一级a毛片一片成人不卡| 韩国欧美一区二区| 欧美美女喷水视频| 国产日韩欧美自拍| 国内自拍在线观看| 日本三级小视频| 久久精品亚洲乱码伦伦中文| 亚洲国产天堂久久综合网| aa日韩免费精品视频一| 欧美一区二区三区影院| 亚洲第一成年人网站| 亚洲制服丝袜av| 国外成人在线视频| 欧美一级免费播放| 日韩 欧美 综合| 久久理论电影网| 中文字幕一区日韩电影| 自拍偷拍亚洲色图欧美| 综合五月激情网| k8久久久一区二区三区| 日韩电影视频免费| 欧美一二三区| 乱老熟女一区二区三区| 国产成人av电影免费在线观看| 精品久久久久久久久久久久久久久| 国产乱人伦精品一区二区| 国产ts丝袜人妖系列视频| 麻豆一区二区三| 91久久香蕉国产日韩欧美9色| 国产一级做a爱免费视频| 少妇高潮一69aⅹ| 久久国产午夜精品理论片最新版本| 日本精品一区二区三区高清 久久| 国产精品中文在线| 国产精品一区二区久久精品 | 国产精品88久久久久久妇女 | 北条麻妃av高潮尖叫在线观看| av动漫免费观看| 久久本道综合色狠狠五月| 欧美激情国内偷拍| 在线亚洲+欧美+日本专区| 国产精品日韩精品欧美在线| 看黄色一级大片| eeuss中文字幕| 色婷婷综合网站| 自拍偷拍亚洲色图欧美| 91久久久一线二线三线品牌| 欧美中文字幕在线播放| 精品处破学生在线二十三| 亚洲成av人片在线|