亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

蘋果光速撤回RLAX論文:用了谷歌TPU和阿里Qwen,作者中還有龐若鳴

IP屬地 中國·北京 機器之心Pro 時間:2025-12-15 16:20:22




機器之心報道

編輯:Panda

昨天,蘋果一篇新論文在 arXiv 上公開然后又匆匆撤稿。原因不明。

不過觀看其提交歷史,可以看到該論文在 12 月 6 日(UTC)就已被提交到 arXiv,到 11 號已經(jīng)過去了 5 天,公開上線之后卻又被光速撤稿,這不由得地讓人好奇究竟發(fā)生了什么。



不過好在該論文有一個 v1 版本已經(jīng)被互聯(lián)網(wǎng)記錄,所以我們也能打開這篇論文一探究竟。

論文中,蘋果揭示了他們開發(fā)的一個基于 TPU 的可擴展 RL 框架RLAX

是的,你沒有看錯,不是 GPU,也不是蘋果自家的 M 系列芯片,而是谷歌的 TPU!還不止如此,這篇論文的研究中還用到了亞馬遜的云和中國的 Qwen 模型。



論文標題:RLAX: Large-Scale, Distributed Reinforcement Learning for Large Language Models on TPUs論文地址:https://arxiv.org/pdf/2512.06392v1

總之,這篇論文的貢獻還真不少。

不過,在具體介紹這篇論文的研究成果之前,我們有必要先關注一下其作者名單。

RLAX 的作者們



RLAX 論文共有四名核心作者:Runlong Zhou、Lefan Zhang、Shang-Chen Wu 和 Kelvin Zou。

通訊作者則是 Kelvin Zou 和 Cheng Leong。其中 Kelvin Zou 曾在蘋果擔任 Principal Engineer,現(xiàn)已經(jīng)入職 meta,成為了一位 AI 研究科學家。而 Cheng Leong 則是已在蘋果工作超過 13 年的老將,現(xiàn)任蘋果 AI Infra(人工智能基礎設施)主管。



截圖自 linkedIn

此外,我們還在作者名單中看到了龐若鳴的名字。

這位已經(jīng)加入 meta 的前蘋果 AI 負責人與其他六位作者的名字一起也出現(xiàn)了論文第一頁的最下方,并被描述為「已離開蘋果公司。他們在受雇于蘋果公司期間為這項工作做出了貢獻。」而且他們基本都是前幾個月才剛剛離職。

簡單搜索一下這六位作者的履歷,可以看到:

Kelvin Zou 加入了 metaHanzhi Zhou 已入職 OpenAIYe Ke 加入了 AnthropicFloris Weers 以創(chuàng)始工程師身份加入了一家正處于隱身狀態(tài)的創(chuàng)業(yè)公司Chong Wang 也加入了 metaYi Zhang 現(xiàn)在 xAI 研究模型推理。

RLAX:為了搶占 TPU 而生

回到技術本身。強化學習(RL)對現(xiàn)代推理語言模型的重要性已無需多言,幾乎所有的頂尖模型都是基于 RL 的推理模型,包括 OpenAI o3、Claude 4、Grok 4、Gemini 2.5、DeepSeek R1 以及 Qwen 3。

蘋果開發(fā)的RLAX 是一個專為在大規(guī)模分布式 TPU 集群上高效執(zhí)行最先進 RL 算法而設計的強化學習框架



極致解耦與搶占式調(diào)度

RLAX 采用了參數(shù)-服務器(Parameter-Server)架構。主訓練器(Master Trainer)會定期將更新后的模型權重推送到參數(shù)服務器。與此同時,一組推理工作器(Inference Workers)會拉取最新權重,并生成新的采樣數(shù)據(jù)(Rollouts)。

該團隊引入了一套系統(tǒng)級技術,將訓練器、推理工作器和驗證器(Verifiers)在邏輯上進行了分離。這種邏輯分離使得 RLAX 能夠靈活且獨立地為各個組件分配計算資源。

最重要的是,RLAX 完全支持搶占式調(diào)度。這意味著當有更高優(yōu)先級的任務(如在線推理負載)需要時,系統(tǒng)可以立即回收 TPU 資源,而不會導致訓練崩潰。

靈活的策略支持

RLAX 致力于解決大規(guī)模 LLM 后訓練 RL 過程中的關鍵挑戰(zhàn),特別是如何高效處理 On-policy(在線策略)和 Off-policy(離線策略)RL。

為此,RLAX 提供了可編程的配置選項。用戶可以強制執(zhí)行「陳舊度界限」(Staleness Bounds),指定推理工作器拉取新權重的頻率,以及訓練器所能容忍的最大 Rollout 陳舊度。這使得用戶可以在 On-policy 和 Off-policy RL 之間靈活選擇。

Oubliette:把代碼扔進地牢

在驗證器(Verifiers)的設計上,蘋果工程師展現(xiàn)了一種特有的黑色幽默。

驗證器需要針對訓練語料庫中每種編程語言進行代碼執(zhí)行驗證。為了高效且確定性地驗證 Python 程序,他們將標準 Python 依賴項容器化。

為了跑通大規(guī)模代碼測試,他們調(diào)用了亞馬遜的 AWS Lambda 服務,并將其命名為 「Oubliette」。

「Oubliette」一詞源自法語,原意是指城堡中只有一個出口(通常是天花板上的活板門)的地下地牢,是專門用來「遺忘」囚犯的地方。

蘋果工程師用這個詞來隱喻他們的無狀態(tài)驗證環(huán)境:代碼和測試數(shù)據(jù)被扔進這個基于 AWS Lambda 的「地牢」里,跑完測試、吐出結果后,整個環(huán)境即刻銷毀,就像這段代碼從未存在過一樣。

表現(xiàn)如何?

有趣的是,在實驗階段,我們看到了一個「縫合怪」的誕生:

算力底座:如論文標題明示的那樣,不是自家芯片,也不是英偉達 GPU,而是谷歌的 TPU v5p(使用了 1024 張 TPU v5p 進行實驗)。驗證環(huán)境:為了跑通大規(guī)模代碼測試,他們調(diào)用了亞馬遜的 AWS Lambda 服務。基礎模型:他們用來驗證這套框架的模型,不是 Apple Intelligence 的底座,而是來自中國阿里團隊開源的 QwQ-32B。

沒錯,蘋果的工程師,在美國用著谷歌的 TPU,調(diào)著亞馬遜的 Serverless 服務,去優(yōu)化一個中國開源的 Qwen 模型。

結果倒是非常亮眼。RLAX 僅用 12 小時 48 分鐘,在 1024 個 v5p TPU 上將 QwQ-32B 的 pass@8 準確率提高了12.8%,同時在訓練期間保持了對任務搶占的魯棒性。



這種「美中技術大亂燉」的場景,在蘋果以往封閉的生態(tài)中簡直不可想象。這也側(cè)面印證了兩件事:第一,在 AI Infra 領域,實用主義正在壓倒門戶之見;第二,國產(chǎn)模型(尤其是 Qwen 和 DeepSeek)在代碼推理領域的統(tǒng)治力,已經(jīng)強到連蘋果都忍不住要拿來當「磨刀石」。

消失的 1.0:一個硬核的數(shù)值幽靈

在 RLAX 論文的第 4 頁和第 9 頁,蘋果披露了一個足以讓系統(tǒng)工程師脊背發(fā)涼的 Bug。

在強化學習中,On-policy(在線策略)訓練有一個理論基石:importance Sampling ratio(重要性采樣比率)r (θ) 應該恒等于 1.0。因為行為策略和當前策略是完全一致的。

但在 TPU 訓練實戰(zhàn)中,蘋果團隊發(fā)現(xiàn):1.0 竟然不等于 1.0



這個問題的根源在于 bfloat16 浮點數(shù)格式的非結合律(Non-associative) 特性。簡單來說,在計算機里 (a+b)+c 和 a+(b+c) 的結果可能存在微小的比特級差異。

推理時:JAX 編譯器為了極致速度,會瘋狂融合算子(Kernel Fusion)。訓練時:為了反向傳播計算梯度,編譯器必須保留中間值,導致算子融合策略與推理時不同。

這種計算順序的微小差異,在 bfloat16 下被放大,導致推理端算出的概率和訓練端算出的概率無法對齊,進而導致訓練崩潰。

蘋果的解決方案非常暴力且有效:他們在訓練器中強制重算(Rematerialization),禁用了大部分激活值的保存,強行讓訓練端的計算圖去「模仿」推理端的計算順序。雖然犧牲了一點點速度,但消除了這個數(shù)值問題。

對于正在從事 LLM Post-training 的工程師來說,這個 Debug 過程極具參考價值。

雖然目前已被撤稿,但 RLAX 證明了蘋果在 AI 基礎設施上依然擁有世界頂級的工程能力。他們能駕馭最復雜的分布式系統(tǒng),解決最底層的數(shù)值難題。

但隨著許多重要人物分散到 meta、OpenAI、Anthropic 和 xAI,這篇論文似乎也成為了蘋果 AI 這一階段的一個注腳。

免責聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其內(nèi)容真實性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

全站最新
精品无码三级在线观看视频| 国产喷白浆一区二区三区| 涩视频在线观看| 国产精品久久久久久久av| 伊人久久中文字幕| 蜜臀久久99精品久久久画质超高清 | 日本天堂网在线| 国产盗摄一区二区三区| 欧美日韩国产综合草草| 日韩av免费看网站| 国产精品视频黄色| 中文字幕欧美人妻精品一区蜜臀| 91麻豆精品在线观看| 亚洲国产精品网站| 麻豆精品传媒视频| 久久成人激情视频| 国内精品视频一区二区三区八戒| 欧美日本国产一区| 99在线视频播放| 亚洲婷婷在线观看| 日韩综合在线视频| 91精品国产品国语在线不卡| 欧洲成人在线视频| 精品人妻一区二区三区四区在线 | 国产成人在线视频观看| 国产日韩欧美精品一区| 九九精品视频在线| 日韩肉感妇bbwbbwbbw| 日韩在线视频免费播放| 国产精品传媒入口麻豆| 欧美在线欧美在线| 男女性杂交内射妇女bbwxz| 日韩精品一二三四| 亚洲成人网久久久| wwwjizzjizzcom| 亚洲毛片在线播放| 亚洲精品中文字幕女同| 97视频在线免费播放| 日韩精品欧美精品| 久久色精品视频| 欧美日韩三级一区二区| 中文国产亚洲喷潮| 中文字幕久久av| 国产成人免费在线| 欧美亚洲午夜视频在线观看| 亚洲成人黄色av| 国产精品美日韩| 国产一区免费| 国产精品久久久久久久一区二区| 亚洲成成品网站| 青青在线免费观看视频| 不卡一区二区在线| 91九色露脸| 99久久精品免费看国产一区二区三区| 欧美日本在线观看| 国产精品自拍合集| 国产午夜福利精品| 精品免费视频123区| 欧洲亚洲国产日韩| 久久精品盗摄| av在线免费看片| 午夜视频在线观看一区二区| 色综合老司机第九色激情| 成人黄色a级片| 五月婷婷另类国产| 日韩av片免费观看| 天天色 色综合| 亚洲一区二区免费视频软件合集| 国产麻豆精品在线| 国产美女久久久| 天天干天天色综合| 色综合久久88色综合天天看泰| 尤物九九久久国产精品的特点| 最新中文字幕2018| 亚洲特黄一级片| 中国一级黄色录像 | 亚洲成人网久久久| 久久精品女同亚洲女同13| 日韩欧美视频一区二区三区| 毛片在线视频观看| 成人h版在线观看| 美女三级99| 国产成人av电影在线播放| 春色成人在线视频| 日韩国产精品久久久久久亚洲| 亚洲精品中文字幕av| 久久久久亚洲AV成人| 久久人人爽人人| 蜜桃视频在线观看一区| 91亚洲国产成人精品性色| 丰满人妻一区二区三区无码av | japanese中文字幕| 亚洲天堂网在线观看| 国产精品一区二区三区四| 激情久久久久久久久久久久久久久久| 国产视频丨精品|在线观看| 国产乡下妇女做爰毛片| 性欧美亚洲xxxx乳在线观看| 人妻无码中文字幕免费视频蜜桃| 国产在线欧美日韩| 中文无字幕一区二区三区 | 成人深夜在线观看| 能看的毛片网站| 91精品久久久久久蜜臀| 国产精品第56页| 国产精品中文在线| 99久久综合色| 999在线精品视频| 日韩精品中文字| 国产成人精品毛片| 日本电影一区二区三区| 亚洲va国产天堂va久久en| 日本污视频网站| 日韩av一级大片| 高清视频一区| 小泽玛利亚av在线| 亚洲精品自拍网| 亚洲AV成人无码精电影在线| 欧美日韩中文字幕在线观看| 亚洲欧洲综合网| 拔插拔插华人永久免费| 黑人巨大精品欧美一区二区小视频 | 日本不卡一区视频| 欧美诱惑福利视频| 欧美精选一区二区| 亚洲人成网站777色婷婷| 91精品婷婷国产综合久久| 蜜乳av一区二区| 999在线精品视频| 日韩欧美电影一区二区| 国产一区在线播放| 中文字幕九色91在线| 97精品久久久久中文字幕| 国产精品一区二区三区99| 日韩Av无码精品| 97在线视频精品| 国产欧美日韩在线| 免费一级片视频| 亚洲精品白虎| 国产成人精品无码高潮| 亚洲最大av在线| 7777精品久久久大香线蕉 | 免费在线看一区| 毛片网站免费观看| 欧美一区二区福利| 亚洲欧美资源在线| 国产亚洲视频系列| 国产又粗又猛又黄视频| 色老头一区二区三区| 天使萌一区二区三区免费观看| 又色又爽又黄18网站| 精品999在线观看| 亚洲社区在线观看| 中文字幕一区二区三| 国产精品怡红院| 成人在线观看一区二区| 欧美日韩精品免费看| 久久天天躁狠狠躁夜夜躁2014| 黄网在线观看视频| 日本一区二区免费看| 日韩在线观看免费| 欧美天堂在线观看| 国产99久久精品| 波多野结衣视频观看| av免费观看不卡| 日本三日本三级少妇三级66| 欧美在线免费视频| 亚洲黄在线观看| 亚洲福利一区二区| 粉嫩蜜臀av国产精品网站| 日韩中文字幕在线观看视频| 国产亚洲精品成人a| 国产大尺度在线观看| 国产精品视频导航| 夜夜嗨av色综合久久久综合网| 午夜精品成人在线视频| 成人免费视频app| 天堂网av2014| 亚洲精品91天天久久人人| 国产精品美腿一区在线看| 色诱视频网站一区| 中文在线资源观看网站视频免费不卡| 天堂网在线播放| 中文字幕视频一区二区| 色婷婷粉嫩av| 奇米777第四色| 91精品无人成人www| 4444亚洲人成无码网在线观看| 97超碰最新| 国产精品久久久久久亚洲影视| 在线不卡国产精品| 亚洲高清不卡av| 欧美日韩国产综合一区二区 | 一区二区视频免费在线观看| 久久久亚洲欧洲日产国码αv| 精品无人区卡一卡二卡三乱码免费卡| www.xxxx国产| 99久久夜色精品国产亚洲| 无码人妻丰满熟妇精品| www.99re6| av成人免费网站| 国产精品久久久久久久久久久久午夜片| 欧美大胆一级视频| 日韩一级欧美一级| 日韩精品一区二区三区在线观看| 在线观看区一区二| 欧美精品久久一区二区三区| 在线看国产一区二区| 91福利国产精品| 欧美丰满美乳xxx高潮www| 3atv在线一区二区三区| 日韩欧美色综合网站| 亚洲国产精品久久久久秋霞不卡| 欧美成人vps| 一夜七次郎国产精品亚洲| 中文字幕视频在线免费欧美日韩综合在线看 | 一区二区欧美国产| 欧日韩精品视频| 欧美精品黑人性xxxx| 亚洲国内精品视频| 中文字幕在线日韩| 久久人人97超碰精品888| 国产精品视频免费观看www| 91精品视频播放| 亚洲一线二线三线视频| 亚洲综合一区在线| 欧美肥胖老妇做爰| 亚洲欧美成人在线| 国内精品久久久| aa成人免费视频| 国产成人免费高清视频| 黄色手机在线视频| 久久午夜精品视频| 成人一二三四区| 日本三级亚洲精品| 中文字幕成人在线观看| 欧美性受xxxx| 精品国偷自产在线视频| 久久久久久久久久网站| 日韩av一卡二卡| 亚洲精品在线不卡| 日韩美女免费观看| 中文字幕欧美日韩一区二区| 久久亚洲一区二区三区四区五区高| 视频一区视频二区视频三区高| 偷偷操不一样的久久| 日韩在线播放av| 免费看91的网站| 一区二区不卡在线视频 午夜欧美不卡在| 最新国产黄色网址| 一区二区在线免费视频| 久草精品视频在线观看| 国产在线精品播放| 又紧又大又爽精品一区二区| 欧美色图校园春色| 精品视频偷偷看在线观看| 日韩久久中文字幕| 欧美黑人视频一区| 在线精品免费视| 欧美大胆人体bbbb| 欧美高清精品一区二区| 亚洲一区二区三区美女| 蜜桃网站在线观看| 欧美精彩视频一区二区三区| 成人精品久久一区二区三区| 亚洲色图27p| 91精品啪在线观看国产60岁| 欧美色图亚洲激情| 91国产视频在线| 久久蜜桃精品| 亚洲一区亚洲二区亚洲三区| 日本最新不卡在线| 视频一区视频二区视频三区高| 蜜臀av性久久久久蜜臀aⅴ流畅 | 亚洲黄一区二区| 日本午夜小视频| 国产精品高潮呻吟久久av无限| 91色乱码一区二区三区| 人妻激情偷乱频一区二区三区| 亚洲欧美一区二区激情| 经典三级在线一区| 丁香婷婷激情网| 欧美日韩综合在线免费观看| 欧美一区二区三区电影在线观看| 日本黄色不卡视频| 九九九九精品九九九九| 国产高清不卡一区二区| 亚洲爆乳无码精品aaa片蜜桃| 国产精品全国免费观看高清| 国产精品久久久久av福利动漫| 国产99久一区二区三区a片| 久久国产色av| 免费观看日韩av| 中文在线观看免费视频| 色综合久久久888| 国产精品系列视频| 久久99导航| 亚洲欧洲另类国产综合| 国产女人18毛片| 国产一区91精品张津瑜| 99热在线这里只有精品| 欧美日韩二区三区| 精品欧美一区二区三区免费观看 | 精产国品一区二区| 国产一区视频在线播放| 麻豆精品在线看| 久久综合久久久| 久久亚洲影视婷婷| 国产chinesehd精品露脸| 日韩精品一区二区三区四区| 国产美女免费网站| 亚洲色图av在线| 91国偷自产中文字幕久久| 国产亚洲精品久久飘花| 亚洲电影第1页| 久久精品免费看| 亚洲午夜精品久久久久久人妖| 欧美精品乱人伦久久久久久| 黄色录像一级片| 欧美亚洲国产日本| 中日韩精品视频在线观看| 日韩av电影在线播放| 成人性生交大片| 亚洲成人福利在线| 91av网站在线播放| 欧美日本韩国一区二区三区视频| 国产69精品久久久久毛片 | 四虎永久在线观看| 岛国大片在线免费观看| 91久久久在线| 欧美精品aⅴ在线视频| 四虎影院在线免费播放| 中文字幕人成一区| 亚洲国产精品精华液网站| 久久久久久久福利| 国内一区在线| 色婷婷综合久久| www.精品视频| 日韩欧美第二区在线观看| 亚洲一二三四在线| 黄色录像免费观看| 成人免费看片网站| 亚洲欧洲在线视频| 国产精品成人一区二区三区夜夜夜| 国产麻豆天美果冻无码视频| 一区二区三区四区乱视频| 男人天堂视频网| 国产精品久久久久9999小说| 国产一区二区久久精品| 亚洲一区在线观看视频| 亚洲伊人成人网| 18禁网站免费无遮挡无码中文| 日韩中文字幕网址| 日韩欧美精品网址| 国产成人无遮挡在线视频| 中文字幕男人天堂| 杨钰莹一级淫片aaaaaa播放| 久久久性生活视频| 国产精品毛片a∨一区二区三区|国| 日韩免费福利电影在线观看| 成人午夜精品在线| 91精产国品一二三| 国产激情美女久久久久久吹潮| 日韩欧美黄色动漫| 老司机精品视频一区二区三区| 熟女丰满老熟女熟妇| 亚洲综合小说区| 在线播放一区二区三区| 九九国产精品视频| 国产艳妇疯狂做爰视频| 国产aaa精品| 欧美日韩久久一区二区| 99热这里都是精品| 日韩高清在线不卡| 欧美 亚洲 另类 激情 另类 | 国产精品爽爽久久久久久| 少妇一级淫片免费放播放| 国产精品旅馆在线| 久久久噜噜噜久久人人看 | 亚洲精品一二三四五区| 成人免费在线网| 亚洲一区综合| 久久久久久久久一区| 国产剧情久久久久久| 欧美黑人一级爽快片淫片高清| 日韩欧美高清在线| 欧美日韩国产一区中文午夜| 亚洲 欧美 激情 另类| 久久精品国产亚洲AV成人婷婷| 激情六月丁香婷婷| 国产成人精品久久亚洲高清不卡| 欧美日韩国产精品成人| 国产精品乱码一区二区三区软件| 午夜精品一二三区| 秘密基地免费观看完整版中文| 国产成年人在线观看| 欧美成人免费视频| 亚洲免费在线观看视频| 国产精品69久久| 91国在线观看| 精品久久久久久久久中文字幕| 99久久精品免费看国产 | 潘金莲一级淫片aaaaaa播放| 先锋资源av在线| 国产69精品久久久久久久| www.久久久| 欧美日本在线一区| 亚洲欧美经典视频| 国产欧美精品一区aⅴ影院| 另类欧美日韩国产在线|