亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁 ? 資訊 ? 新科技 ? 正文

只靠國產(chǎn)算力預(yù)訓(xùn)練,穩(wěn)!全流程開源,「開元」盛世真來了

IP屬地 中國·北京 新智元 時間:2025-12-21 10:12:46


新智元報道

編輯:LRST

當(dāng)算力受限、數(shù)據(jù)參差,如何訓(xùn)練出高效可用的端側(cè)模型?鵬城實驗室聯(lián)合清華不僅給出了答案,更將每一步都開源共享。

如果實驗室只有國產(chǎn)算力、有限資源與開源數(shù)據(jù),能否玩轉(zhuǎn)端側(cè)模型的預(yù)訓(xùn)練?

鵬城實驗室與清華大學(xué)PACMAN實驗室聯(lián)合發(fā)布了鵬城腦海?2.1?開元?2B(PCMind?2.1?Kaiyuan?2B,簡稱開元?2B)模型,并以全流程開源的方式回應(yīng)了這一挑戰(zhàn)——從訓(xùn)練數(shù)據(jù)、數(shù)據(jù)處理框架、訓(xùn)練框架、完整技術(shù)報告到最終模型權(quán)重,全部開源。


模型鏈接:https://huggingface.co/thu-pacman/PCMind-2.1-Kaiyuan-2B

數(shù)據(jù)集:https://huggingface.co/datasets/thu-pacman/PCMind-2.1-Kaiyuan-2B

技術(shù)報告:https://arxiv.org/abs/2512.07612

數(shù)據(jù)處理框架:https://github.com/thu-pacman/Kaiyuan-Spark

訓(xùn)練框架:https://github.com/thu-pacman/kaiyuan-mindformers


此次開源不僅為國內(nèi)研究者提供了一條可復(fù)現(xiàn)、可迭代的技術(shù)路徑,也展現(xiàn)了在國產(chǎn)計算平臺上實現(xiàn)高效、穩(wěn)定預(yù)訓(xùn)練的完整解決方案。

開元?2B的訓(xùn)練依托鵬城腦海 2計算平臺,數(shù)據(jù)處理基于華為鯤鵬920,訓(xùn)練系統(tǒng)基于華為昇騰 910A

由于昇騰910A僅支持FP16精度(類似于NVIDIA V100),訓(xùn)練穩(wěn)定性成為首要挑戰(zhàn)。

為此,研究團隊在 Qwen3?1.7B 的架構(gòu)基礎(chǔ)上,引入了三明治范數(shù)(Sandwich Norm)軟裁剪(Soft Clipping)兩項關(guān)鍵技術(shù)。

三明治范數(shù)在Transformer每層前后保留歸一化層,有效控制梯度傳播中的數(shù)值范圍

軟裁剪通過對輸出logits應(yīng)用tanh非線性變換,將數(shù)值穩(wěn)定在合理區(qū)間內(nèi),防止訓(xùn)練發(fā)散




加上三明治范數(shù)和軟裁剪前后的數(shù)值穩(wěn)定性對比

這些技術(shù)不僅使訓(xùn)練在FP16環(huán)境下保持穩(wěn)定,也為后續(xù)國產(chǎn)平臺上的大規(guī)模訓(xùn)練提供了重要參考。

開源數(shù)據(jù)

去重、評價與高效利用

當(dāng)前開源預(yù)訓(xùn)練數(shù)據(jù)規(guī)模已達TB級別,來源多樣、質(zhì)量不均,如何從中篩選出高質(zhì)量部分并制定混合策略,是訓(xùn)練優(yōu)質(zhì)模型的基礎(chǔ)。

開元?2B面對兩個核心問題:

如何從海量數(shù)據(jù)中篩選高質(zhì)量子集?

如何在不同數(shù)據(jù)集之間建立統(tǒng)一的質(zhì)量評價標準?


全局去重的高效實現(xiàn):Kaiyuan?Spark框架

研究團隊開發(fā)了Kaiyuan?Spark數(shù)據(jù)處理框架,采用樹狀流水線設(shè)計,全程YAML配置管理,易于復(fù)現(xiàn)與擴展。

結(jié)合諸葛弩計算框架進行本地加速,在 MinHash 去重任務(wù)中實現(xiàn)端到端2.5倍的加速比,高效完成TB級數(shù)據(jù)的全局模糊去重。

分位標定(Quantile Benchmarking)

為解決數(shù)據(jù)集之間質(zhì)量標簽不可比的問題,團隊提出分位標定:通過設(shè)計小規(guī)模探針實驗,構(gòu)建數(shù)據(jù)質(zhì)量分數(shù)與下游任務(wù)表現(xiàn)之間的映射關(guān)系。


分位標定流程示意圖

具體做法為:從不同數(shù)據(jù)集中按質(zhì)量分位數(shù)抽取多個子集,然后使用小規(guī)模模型進行訓(xùn)練測試,最后根據(jù)下游任務(wù)表現(xiàn)反向標定各數(shù)據(jù)集的質(zhì)量區(qū)間。

該方法成本低、可遷移,為后續(xù)大規(guī)模訓(xùn)練的數(shù)據(jù)配比提供了科學(xué)依據(jù)。

關(guān)鍵發(fā)現(xiàn)

基于分位標定,團隊得出若干有趣發(fā)現(xiàn):

數(shù)據(jù)集的優(yōu)勢與任務(wù)類型相關(guān)

Fineweb?Edu在知識問答與閱讀理解類任務(wù)上表現(xiàn)更好,DCLM?baseline 在常識推理類任務(wù)中略有優(yōu)勢。


DCLM baseline和Fineweb-Edu在MMLU和WinoGrande上的分位標定結(jié)果

同一數(shù)據(jù)集內(nèi)部質(zhì)量差異巨大

最高與最低質(zhì)量數(shù)據(jù)在ARC?Easy上的表現(xiàn)相差可達8%?15%


DCLM baseline和Fineweb-Edu在ARC-Easy上的分位標定結(jié)果

可以看到,高質(zhì)量數(shù)據(jù)占比雖小,卻是提升模型能力的關(guān)鍵。

數(shù)據(jù)利用策略

動態(tài)調(diào)整與課程學(xué)習(xí)

針對數(shù)據(jù)分布不均的問題,開元?2B提出三個策略。

多階段動態(tài)比例調(diào)整

隨著訓(xùn)練推進,逐步提升數(shù)學(xué)、代碼、中文等領(lǐng)域數(shù)據(jù)的比例,緩解模型遺忘,使關(guān)鍵領(lǐng)域在訓(xùn)練后期得到充分學(xué)習(xí)。


多階段調(diào)整數(shù)據(jù)比例

策略性數(shù)據(jù)重復(fù)


小規(guī)模實驗表明,對高質(zhì)量數(shù)據(jù)進行適度重復(fù)訓(xùn)練,效果優(yōu)于單輪訓(xùn)練。開元?2B在訓(xùn)練后期逐步提高高質(zhì)量數(shù)據(jù)的重復(fù)比例。

以Fineweb-Edu為例:Top 10%的高質(zhì)量數(shù)據(jù)在整個訓(xùn)練過程中出現(xiàn)多次,中低質(zhì)量數(shù)據(jù)僅出現(xiàn)一次,從而優(yōu)化數(shù)據(jù)效用分布。


Fineweb-Edu在多階段訓(xùn)練中采樣比例變化

多領(lǐng)域混合課程學(xué)習(xí)

研究團隊提出Curriculum Decay Model Average,在課程學(xué)習(xí)的基礎(chǔ)上引入權(quán)重平均,緩解訓(xùn)練噪聲,提升收斂穩(wěn)定性。


論文鏈接:https://arxiv.org/abs/2511.18903

該方法通過領(lǐng)域內(nèi)質(zhì)量排序領(lǐng)域間比例均衡的結(jié)合,實現(xiàn)多領(lǐng)域數(shù)據(jù)的漸進式學(xué)習(xí)。


學(xué)習(xí)率衰減會影響課程學(xué)習(xí)效果


不同學(xué)習(xí)率衰減條件下,最優(yōu)的課程學(xué)習(xí)+權(quán)重平均配置(Ascend+EMA)要強于最優(yōu)的常見做法(Uniform+WSD)


多領(lǐng)域課程的實現(xiàn)

配合精心設(shè)計的學(xué)習(xí)率調(diào)度方案,模型在高質(zhì)量數(shù)據(jù)上得以充分學(xué)習(xí),最終在多類評測中接近千問系列(僅開源權(quán)重)的模型表現(xiàn)。

全流程開源

推動國產(chǎn)AI生態(tài)共建

開元?2B不僅是一次端側(cè)模型訓(xùn)練的實踐,更是一次全棧開源、全流程透明的技術(shù)示范。

從數(shù)據(jù)處理框架Kaiyuan?Spark、訓(xùn)練數(shù)據(jù)集,到數(shù)據(jù)評價體系、課程學(xué)習(xí)策略,所有環(huán)節(jié)均公開可復(fù)現(xiàn)。訓(xùn)練中涉及的所有原始數(shù)據(jù)集均具有寬松的開源協(xié)議(如CC、Apache、MIT、ODC等,詳細列表技術(shù)報告附錄B),個人、院校、企業(yè)均可自由使用,進一步提升了訓(xùn)練的可復(fù)現(xiàn)性。

注:目前部分聲稱「開放」的公開數(shù)據(jù)集,事實上本身并非使用自由許可證授權(quán),或者間接混入了帶有非自由許可證的原始數(shù)據(jù);另有大量的公開數(shù)據(jù)集,對來源數(shù)據(jù)的許可證未加任何篩選或說明。在模型訓(xùn)練中使用此類數(shù)據(jù)集并發(fā)布或使用,都可能帶來潛在的法律合規(guī)風(fēng)險。

這為國內(nèi)研究者在國產(chǎn)算力平臺上開展模型預(yù)訓(xùn)練提供了完整工具箱,也為構(gòu)建開放、協(xié)作的 AI 研發(fā)生態(tài)邁出堅實一步。

模型權(quán)重、技術(shù)報告與相關(guān)代碼已在官方平臺發(fā)布,歡迎開發(fā)者、研究者共同參與測試、改進與拓展。

結(jié)語

真正的技術(shù)進步源自開放的協(xié)作與共享,開元?2B是一個起點,未來與社區(qū)一起,在國產(chǎn)算力的土壤上,生長出更多創(chuàng)新的AI成果,從開元系列,開啟國產(chǎn)算力訓(xùn)練的「開元盛世」

附錄









左右滑動查看

參考資料:

秒追ASI

?點贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點亮星標,鎖定新智元極速推送!

免責(zé)聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

国产黄色激情视频| 水蜜桃在线免费观看| 亚洲尤物视频在线| 日本午夜精品视频| 2022国产精品| 精品成人乱色一区二区| 欧美在线观看不卡| 天天好比中文综合网| 在线不卡一区二区| 性生活黄色大片| 欧美日韩在线视频一区二区三区| 一本色道久久综合狠狠躁篇怎么玩| 轻轻草成人在线| 亚洲一级片网站| 色青青草原桃花久久综合| 精品一区免费av| 91精品又粗又猛又爽| 国产精品久久999| 亚洲一区在线观看免费| 樱花视频在线免费观看| a级片一区二区| 国产香蕉一区二区三区在线视频 | 国产伦精品一区二区三区妓女| 国产精品成人av性教育| 亚洲成av人影院| 亚洲天堂视频在线| 国产97在线 | 亚洲| 久久99久国产精品黄毛片入口| 国产日韩欧美高清| 国产乡下妇女做爰视频| 可以免费看的黄色网址| 一区二区欧美久久| 久久久亚洲精品石原莉奈| 老司机深夜福利网站| 欧美日韩一区在线视频| 亚洲成人激情在线| 国产成人精品免费在线| 青青青视频在线播放| 欧美日韩电影一区二区三区| 亚洲精品av在线| 成人网页在线观看| 久久黄色免费视频| 台湾无码一区二区| 欧美日韩aaaa| 亚洲国产一区在线观看| 99久久精品国产色欲| 亚洲一级免费在线观看| 国产欧美日韩精品在线观看| 欧美日韩精品一区二区三区四区 | 亚洲综合一区二区三区| 中文字幕资源网| 粉色视频免费看| 成人精品一区二区三区电影免费| 欧美群妇大交群中文字幕| 六月婷婷色综合| 蜜桃av免费观看| 干日本少妇视频| 久久久久久久网站| 午夜av一区二区| 污视频网站在线播放| 三级黄色片网站| 视频三区二区一区| 精品国内产的精品视频在线观看| 亚洲免费视频成人| 黄色av小说在线观看| 亚洲一区二区在线免费| 欧美一区二区三区精美影视| 深夜精品寂寞黄网站在线观看| 自拍偷自拍亚洲精品播放| 国产免费黄色录像| 中文成人无字幕乱码精品区| 日本视频精品一区| 久久综合五月天| 欧美日韩亚洲精品一区二区三区| 青青国产91久久久久久| 欧美性生交大片| 欧美乱大交xxxxx潮喷l头像| 国产成人精品电影| 日韩免费电影网站| 国产午夜亚洲精品不卡| 国产精品久久久久久久久毛片| 又大又长粗又爽又黄少妇视频| 精品乱子伦一区二区三区 | 久久日韩精品| 精品国产一区久久久| 天天综合网 天天综合色| 免费不卡在线视频| 精品视频久久久久| 亚洲天堂av一区二区| 精品久久久久久一区二区里番| 久久精品国产欧美激情| 一本色道综合亚洲| 成人性视频免费网站| 欧美一区二区三区不卡视频| 亚洲国产精品第一页| 亚洲人成网站在线观看播放| 2020欧美日韩在线视频| 日韩欧美一二三四区| 国产日产欧美一区二区视频| 欧美 日韩 国产 成人 在线| 国产美女久久久久久| 激情综合网俺也去| 久久久人人爽| 久久频这里精品99香蕉| 欧美一级夜夜爽| 日韩一区在线看| 免费一级欧美片在线观看| 精品美女久久久久| 国产高潮视频在线观看| 欧美 亚洲 视频| 91精品视频观看| 久久精品欧美视频| 欧美日韩一区成人| 国产精品美女久久久久aⅴ| 亚洲三区在线播放| 日本在线观看视频网站| 97中文字幕在线观看| 欧美 日韩 国产精品| 亚洲自拍偷拍福利| 久久91亚洲精品中文字幕| 日韩欧美第一区| 亚洲午夜在线电影| 成人激情午夜影院| 天天爱天天干天天操| 国产一级片免费看| 久久人人爽人人爽人人片| 日韩中文字幕在线视频观看| 欧美三级网色| 国产精品综合久久久| 日韩在线中文视频| 日韩一区二区三区三四区视频在线观看 | 精品久久久久久中文字幕大豆网 | 国内老熟妇对白xxxxhd| 少妇影院在线观看| 成人在线视频免费播放| 欧美极品欧美精品欧美图片| 神马影院我不卡| 亚洲japanese制服美女| 国产69精品久久久久9999| 国产网站欧美日韩免费精品在线观看| 日韩欧美国产免费播放| 国产精品天美传媒沈樵| 国产精品系列在线播放| 天堂在线中文网| 中文字幕av久久爽| 国产在线综合网| 国产jk精品白丝av在线观看| 午夜视频在线观| 免费国产黄色网址| 在线观看日本一区| 久久久7777| 91免费观看| 国产成人一区二区在线| 欧美二区在线播放| 怡红院精品视频| 精品国产乱码久久久久久久 | 国产精品极品美女在线观看免费 | 色爱区成人综合网| 粉嫩av一区二区三区免费观看| 欧洲成人午夜免费大片| 欧美成人激情在线| 在线精品91av| 亚洲美女在线看| 欧美成人免费网站| 在线播放/欧美激情| 色偷偷88欧美精品久久久| 亚洲午夜私人影院| 136国产福利精品导航| 国产亚洲精品中文字幕| 不卡一区二区三区四区| 国产精品一卡二卡在线观看| 麻豆91在线播放| 青青草成人在线观看| 婷婷五月综合久久中文字幕| 国产女人18毛片水真多| 中文字幕av片| 天天射天天干天天| 成人h动漫精品一区二区下载| 久久久久久久伊人| 久久国产在线视频| 国产精品成人av久久| 九九视频在线观看| 欧美精品乱码视频一二专区| 欧美一级特黄高清视频| 国产wwwwxxxx| 成人一级黄色大片| 综合五月激情网| 麻豆视频在线免费看| 一区二区成人免费视频| 欧美精品久久久久久久久46p| www成人啪啪18软件| 青青草自拍偷拍| 五月婷婷综合激情网| 欧美风情第一页| 青青草原免费观看| 日韩特黄一级片| av片免费观看| 91久久久久国产一区二区| 国产熟女一区二区丰满| 亚洲精品中文字幕成人片| 手机av免费在线观看| 久热精品视频| 激情综合亚洲精品| 成人免费黄色大片| 久久久精品天堂| 自拍偷拍亚洲欧美日韩| 艳妇臀荡乳欲伦亚洲一区| 亚洲成av人片一区二区梦乃 | 日本欧美一级片| 国产精品美乳在线观看| 国产精品白嫩初高中害羞小美女 | 天天操天天干天天爱| 日韩在线视频免费| 日日摸夜夜添夜夜添精品视频| 久久99在线观看| 99这里只有精品| 国产精品国产三级国产三级人妇| 一二三四社区欧美黄| 色八戒一区二区三区| 日韩欧美国产精品一区| 亚洲色图狂野欧美| 欧美激情第6页| 国产精品久久久久av| av资源一区二区| 日本一区视频在线观看免费| 天堂а√在线中文在线| 成人性视频欧美一区二区三区| 深爱五月综合网| 国产精品815.cc红桃| 欧美爱爱小视频| 精品黑人一区二区三区| 囯产精品一品二区三区| 精品亚洲aⅴ乱码一区二区三区| 99久久久精品免费观看国产蜜| 亚洲欧美一区二区在线观看| 色婷婷av一区二区三区之一色屋| 日韩欧美一区二区久久婷婷| 自拍偷拍亚洲一区| 秋霞午夜一区二区| 狠狠色综合欧美激情| ijzzijzzij亚洲大全| 黄色成人免费看| 在线不卡av电影| 九九精品免费视频| 亚洲欧美日韩动漫| 91丝袜呻吟高潮美腿白嫩在线观看| 亚洲伦在线观看| 欧美一区二区三区男人的天堂| 色综合亚洲精品激情狠狠| 国产精品v日韩精品| 精品一区二区三区国产| 97在线国产视频| 中国特级黄色大片| 日韩欧美一区二区一幕| 六月婷婷综合网| 成人动漫一区二区| 午夜久久久久久久久| 精品国产伦一区二区三区观看体验 | 国产欧美小视频| 免费av网站在线| 日本女优在线视频一区二区| 国产视频亚洲色图| 欧美午夜寂寞影院| 色诱女教师一区二区三区| 成人精品一区二区三区| 免费久久久久久| 久久久久亚洲av无码专区首jn| 欧美成人手机视频| 黄色aaa毛片| 26uuu精品一区二区三区四区在线| 欧美视频专区一二在线观看| 尤物九九久久国产精品的分类 | 日本不卡123| 国产精品久久久久国产精品日日 | 91网站在线免费观看| 在线综合视频网站| 国产免费a级片| 欧美 日韩 精品| 激情国产一区二区| 黄色成人在线免费| 中文日韩在线视频| 999精品视频一区二区三区| 九色自拍视频在线观看| av男人的天堂av| 99在线小视频| 国产日韩综合av| 欧美一区二区性放荡片| 97在线视频精品| 在线视频亚洲自拍| 中文成人无字幕乱码精品区| 91激情在线观看| 99re66热这里只有精品3直播| 欧美日韩欧美一区二区| 久久久久久久国产精品视频| 先锋影音日韩| 成人免费看aa片| 精品国产无码AV| 欧美激情在线一区二区| 精品999在线播放| 91免费看国产| 日韩精品你懂的| 久久久午夜影院| 国产乱一区二区| 欧美色精品在线视频| 欧美国产日韩一区二区在线观看| 欧美黑人3p| 免费黄色三级网站| 99免费在线视频| 国产精品久久久久国产精品日日| 国产视频一区在线| 国产精品一区二区三区精品 | 国产绳艺sm调教室论坛| 久久久蜜桃精品| 亚洲精品91美女久久久久久久| 99免费在线视频观看| 午夜久久久精品| 成人午夜视频在线播放| 91首页免费视频| 亚洲激情视频在线播放| 国产精品一级久久久| 免费黄色在线播放| 国产乱淫av免费| 亚洲欧美另类小说视频| 久久精品精品电影网| 成人福利小视频| 国产呦精品一区二区三区网站| 99国产精品免费视频| 2019最新中文字幕| 国产欧美日韩三级| 国产乱了高清露脸对白| 国产成人综合精品| 玉足女爽爽91| 久草视频在线免费看| 亚洲国产精品毛片| 日韩午夜在线影院| 性少妇videosexfreexxx片| 欧美一级视频免费看| 国产精品久久久久一区二区| 色偷偷噜噜噜亚洲男人| 色先锋资源久久综合| 五月天中文字幕| 26uuu国产| 色播五月综合| 欧美多人爱爱视频网站| 久久久久久久久久电影| 激情综合丁香五月| 日本一区二区三区视频免费看| 中文字幕亚洲无线码a| 国产精品玖玖玖| 久久露脸国语精品国产91| 好吊视频在线观看| 动漫美女无遮挡免费| 国产一区二区在线免费播放| 国产精品一区二区三区在线| 久久久久久久久综合| 欧美性生交片4| 黄色小说综合网站| 免费看日韩毛片| 正义之心1992免费观看全集完整版| 国产精品中文在线| 日韩成人在线免费观看| 久久综合一区二区| 国产三级精品在线观看| free性中国hd国语露脸| 好吊色欧美一区二区三区视频 | 激情五月六月婷婷| 含羞草久久爱69一区| 国产精品69久久| 日韩欧美亚洲国产一区| 波多野结衣视频一区| 人人妻人人澡人人爽精品日本| 亚洲视频重口味| 日日橹狠狠爱欧美超碰| 色偷偷偷亚洲综合网另类| 欧美性色综合网| 亚洲国产中文字幕| av资源站一区| 91视频一区二区| 日本一区二区久久| 国产欧美精品日韩区二区麻豆天美| 国产嫩草影院久久久久| 亚洲欧洲日产国产综合网| 一区二区三区在线影院| 亚洲一区在线观看网站| 亚洲日本丝袜连裤袜办公室| 久久精品一区蜜桃臀影院| 成人精品鲁一区一区二区| 日日摸夜夜添夜夜添亚洲女人| 69av.com| 亚洲欧美高清在线| 欧美性大战久久久久xxx| 无码粉嫩虎白一线天在线观看 | 色妞久久福利网| 欧美二区乱c少妇| 国产精品久久夜| 丁香婷婷综合网| 欧美一级片免费| 老司机午夜福利视频| 国产哺乳奶水91在线播放| 丝瓜av网站精品一区二区| 欧美一区二区三区成人片在线| 精品国产区一区二| 草久视频在线观看| 九九热在线视频播放| 久久精品国产av一区二区三区| 美女流白浆视频| 2018中文字幕第一页| 日本一区二区三区在线视频 | 免费在线激情视频| 在线免费观看成年人视频|