Cursor發布首個編程大模型！代碼生成250tokens/秒，強化學習+MoE

IP屬地中國·北京 量子位 時間：2025-10-30 10:16:00

Jay 發自凹非寺量子位 | 公眾號 QbitAI
Cursor的首個編碼模型，剛剛發布了！
最新進展，Cursor 2.0正式發布，并且首次搭載了「內部」大模型。
沒錯，不是GPT、不是Claude，如今模型欄多了個新名字——Composer
實力相當炸裂：
據官方說法，Composer僅需30秒就能完成復雜任務，比同行快400%
基于模型升級，Cursor 2.0帶來了不少新玩意兒——
原生瀏覽器工具：模型可以自己動手測試代碼、調錯、迭代，直到結果完全正確。
語音生成代碼：不用敲鍵盤，張嘴就行，直接把思路變成代碼。
全新界面邏輯：從「以文件為中心」切換為「以Agent為中心」，多個Agent可以同時運行、互不干擾。
讓多個Agent同時嘗試同一問題并擇優采用，能顯著提升最終結果。

太多了太多了，根本看不完。
400%效率飛躍
當然，其他的都是小菜，最炸裂的依然是——Cursor居然有了自己的基座模型
要知道，以前的Cursor雖然火，但本質上還只是套殼GPT或Claude，再厲害也不是Cursor的功勞。
而這次不一樣，Composer正式登場，Cursor終于能挺直腰板了。
難怪這回官網介紹語氣都硬氣了不少。（doge）
Cursor表示，這款模型是專為低延遲編碼打造的，可以在 30秒內完成大多數交互任務。
即便面對體量龐大、結構復雜的代碼庫，也能保持高水準的推理與理解能力。
除了酷炫的Demo，當然還要用Benchmark秀秀肌肉。

Composer的性能全部通過內部測試套件「Cursor Bench」測得——這是一個根據真實開發者使用場景打造的評估系統。
該Benchmark不僅看代碼是否正確，還評估模型是否能遵守抽象層次、風格規范和工程實踐。
結果顯示：Composer能以每秒250個tokens的速度生成代碼。
這速度比當前最快的推理模型（GPT-5、Claude Sonnet 4.5）快約兩倍，比其其他模型更是快四倍。
速度快了，但腦子依然靈活，Composer顯著提高了推理能力和任務泛化能力，水準可媲美中等前沿模型，
基于強化學習的MoE自研模型
這么驚艷的表現，究竟是怎么煉成的？
Cursor研究科學家Sasha Rush透露了答案——關鍵在于強化學習。
我們用強化學習訓練了一個大型MoE模型，讓它更貼近真實的編程任務，而且速度也非常快。

同時，為了和強化學習打配合，Cursor把自己在產品上的優勢發揮到了極致。
和其他機器學習方法不同，強化學習幾乎無法從完整系統里抽象出太多內容。所以我們讓Composer和Cursor一同設計，確保它能在真實規模下順暢運行。

強化學習最大的特點是：它得在真實環境里「干活」，才能學到真本事。
如果Composer只在虛擬數據集里改改代碼，它根本不知道這些代碼有沒有bug、測試能不能過。
所以，Cursor干脆讓模型直接進「上戰場」。在完整的 Cursor 環境中運行、調用工具、執行命令，通過一次次真實交互，拿到最有效的反饋信號。
具體來說，Composer的訓練不是喂靜態數據集，而是基于真實的軟件工程任務完成的。
訓練時，模型直接在完整代碼庫里動手，用上整套生產級工具：文件編輯、語義搜索、終端命令……
面對復雜工程問題，它必須自己寫、自己測、自己修。
每一輪訓練都對應一個具體任務，比如寫一段改動、擬一份方案，或者解釋某個代碼邏輯。
事實證明，強化學習確實讓Composer的表現上了一個臺階。
它學會了如何聰明地選工具、靈活地做并行處理，不再會一拍腦袋給用戶抽張廢卡。
隨著訓練深入，模型甚至出現了涌現行為——能自動運行單元測試、修復代碼格式錯誤，甚至可以自主完成多步代碼搜索與調試流程。
而Cursor 2.0這次為多Agent協作提供的基礎架構，正式建立在Composer這些底層能力的基礎之上。

值得注意的是，這次Cursor帶來的不只是一個更快的模型，而是一個真正面向實戰的AI系統。
相比一味去和那些頭部基座模型硬剛，Cursor這次更聰明地發揮了自己在應用端的產品優勢——
讓Composer直接在與用戶相同的環境中運行，真正做到貼合開發者的日常工作流程。
Cursor，你真的是自研嗎？
話說回來，Composer的效果確實很驚艷，但Cursor似乎在故意回避一個問題——
強化學習沒問題，但模型底子你倒是說清楚啊。
Composer的透明度缺失簡直離譜。他們提到用了強化學習，但沒交代模型的其他訓練過程——
到底是自己預訓練的，還是拿現成模型改的？
在他們公開更多細節、或有人能獨立復現結果之前，我對這些說法都持保留態度。

Cursor研究員Sasha Rush這些天也一直在 Hacker News 上親自答疑，但對于「基礎模型來源」這個問題，她始終沒正面回應。
當被直接問到「Composer是不是微調自某個開源模型？」時，Rush的回答是：
我們的主要關注點在于強化學習的后訓練階段，我們認為這是使模型成為強大的交互式智能體的最佳途徑。
不過可以確定的是，Cursor過去確實有自己的內部模型。
據悉，Cheetah是Composer的早期原型，團隊曾用它來測試生成速度與系統集成效果。
不過嘛，正式版Composer到底是基于Cheetah，還是從開源模型的骨架上改的……
還需要讓子彈再飛一會兒～

[1]https://news.ycombinator.com/item?id=45748725
[2]https://simonwillison.net/2025/Oct/29/cursor-composer/
[3]https://venturebeat.com/ai/vibe-coding-platform-cursor-releases-first-in-house-llm-composer-promising
[4]https://cursor.com/cn/blog/2-0
[5]https://x.com/srush_nlp/status/1983572683355725869
[6]https://x.com/cursor_ai/status/1983567619946147967

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

設立“虛擬公司”，上海布局合成生物顛覆性技術項目｜跟著項目經理看未來產業

越獄新曙光：iOS 26.2 Beta 1以下版本關鍵漏洞公開

AI巨頭擬500億美元入局AI基建

《汽車數據出境安全評估方法》團體標準發布

蘋果2026 iPad路線圖曝光：三款新品齊發，mini迎來史詩級升級

100%國產化！國產機器人靈巧手突破“卡脖子”壁壘

全站最新

設立“虛擬公司”，上海布局合成生物顛覆性技術項目｜跟著項目經理看未來產業

越獄新曙光：iOS 26.2 Beta 1以下版本關鍵漏洞公開

AI巨頭擬500億美元入局AI基建

《汽車數據出境安全評估方法》團體標準發布

熱門推薦

設立“虛擬公司”，上海布局合成生物顛覆性技術項目｜跟著項目經理看未來產業

越獄新曙光：iOS 26.2 Beta 1以下版本關鍵漏洞公開

AI巨頭擬500億美元入局AI基建

《汽車數據出境安全評估方法》團體標準發布

蘋果2026 iPad路線圖曝光：三款新品齊發，mini迎來史詩級升級

100%國產化！國產機器人靈巧手突破“卡脖子”壁壘

廣汽能源聯動支付寶推出“碰一下”支付，AI支持選址、動態定價

機降突擊！陸航多型直升機沖向目標地域

科學與健康｜月球也會“生銹”？嫦娥六號月背樣品中首次發現晶質赤鐵礦

馬斯克最新訪談：目標每年在太空部屬100吉瓦AI衛星

未來的iPhone，想靠衛星消滅無服務

2025中國國際石墨烯創新大會在溫州舉行多項關鍵技術取得突破

創新是走出低谷、完成突破的動力（親歷者說）

線下線上齊發力，渝貨出山有實招

觀察|全固態電池商業化時間表成爭議焦點，高成本或阻礙推廣

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

首頁

新科技

新金融

新零售

智能車

房地產

科技探索

人物資訊

網絡游戲

人工智能

Cursor發布首個編程大模型！代碼生成250tokens/秒，強化學習+MoE

400%效率飛躍

基于強化學習的MoE自研模型

Cursor，你真的是自研嗎？

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

Cursor發布首個編程大模型！代碼生成250tokens/秒，強化學習+MoE

400%效率飛躍

基于強化學習的MoE自研模型

Cursor，你真的是自研嗎？

同類資訊

Cursor發布首個編程大模型！代碼生成250tokens/秒，強化學習+MoE

Cursor，你真的是自研嗎？