Jay 發自 凹非寺量子位 | 公眾號 QbitAI
Cursor的首個編碼模型,剛剛發布了!
最新進展,Cursor 2.0正式發布,并且首次搭載了「內部」大模型。
沒錯,不是GPT、不是Claude,如今模型欄多了個新名字——Composer
實力相當炸裂:
據官方說法,Composer僅需30秒就能完成復雜任務,比同行快400%
基于模型升級,Cursor 2.0帶來了不少新玩意兒——
原生瀏覽器工具:模型可以自己動手測試代碼、調錯、迭代,直到結果完全正確。
語音生成代碼:不用敲鍵盤,張嘴就行,直接把思路變成代碼。
全新界面邏輯:從「以文件為中心」切換為「以Agent為中心」,多個Agent可以同時運行、互不干擾。
讓多個Agent同時嘗試同一問題并擇優采用,能顯著提升最終結果。
![]()
太多了太多了,根本看不完。
400%效率飛躍
當然,其他的都是小菜,最炸裂的依然是——Cursor居然有了自己的基座模型
要知道,以前的Cursor雖然火,但本質上還只是套殼GPT或Claude,再厲害也不是Cursor的功勞。
而這次不一樣,Composer正式登場,Cursor終于能挺直腰板了。
難怪這回官網介紹語氣都硬氣了不少。(doge)
Cursor表示,這款模型是專為低延遲編碼打造的,可以在 30秒內完成大多數交互任務。
即便面對體量龐大、結構復雜的代碼庫,也能保持高水準的推理與理解能力。
除了酷炫的Demo,當然還要用Benchmark秀秀肌肉。
![]()
Composer的性能全部通過內部測試套件 「Cursor Bench」 測得——這是一個根據真實開發者使用場景打造的評估系統。
該Benchmark不僅看代碼是否正確,還評估模型是否能遵守抽象層次、風格規范和工程實踐。
結果顯示:Composer能以每秒250個tokens的速度生成代碼。
這速度比當前最快的推理模型(GPT-5、Claude Sonnet 4.5)快約兩倍,比其其他模型更是快四倍。
速度快了,但腦子依然靈活,Composer顯著提高了推理能力和任務泛化能力,水準可媲美中等前沿模型,
基于強化學習的MoE自研模型
這么驚艷的表現,究竟是怎么煉成的?
Cursor研究科學家Sasha Rush透露了答案——關鍵在于強化學習。
我們用強化學習訓練了一個大型MoE模型,讓它更貼近真實的編程任務,而且速度也非常快。
![]()
同時,為了和強化學習打配合,Cursor把自己在產品上的優勢發揮到了極致。
和其他機器學習方法不同,強化學習幾乎無法從完整系統里抽象出太多內容。所以我們讓Composer和Cursor一同設計,確保它能在真實規模下順暢運行。
![]()
強化學習最大的特點是:它得在真實環境里「干活」,才能學到真本事。
如果Composer只在虛擬數據集里改改代碼,它根本不知道這些代碼有沒有bug、測試能不能過。
所以,Cursor干脆讓模型直接進「上戰場」。在完整的 Cursor 環境 中運行、調用工具、執行命令,通過一次次真實交互,拿到最有效的反饋信號。
具體來說,Composer的訓練不是喂靜態數據集,而是基于真實的軟件工程任務完成的。
訓練時,模型直接在完整代碼庫里動手,用上整套生產級工具:文件編輯、語義搜索、終端命令……
面對復雜工程問題,它必須自己寫、自己測、自己修。
每一輪訓練都對應一個具體任務,比如寫一段改動、擬一份方案,或者解釋某個代碼邏輯。
事實證明,強化學習確實讓Composer的表現上了一個臺階。
它學會了如何聰明地選工具、靈活地做并行處理,不再會一拍腦袋給用戶抽張廢卡。
隨著訓練深入,模型甚至出現了涌現行為——能自動運行單元測試、修復代碼格式錯誤,甚至可以自主完成多步代碼搜索與調試流程。
而Cursor 2.0這次為多Agent協作提供的基礎架構,正式建立在Composer這些底層能力的基礎之上。
![]()
值得注意的是,這次Cursor帶來的不只是一個更快的模型,而是一個真正面向實戰的AI系統。
相比一味去和那些頭部基座模型硬剛,Cursor這次更聰明地發揮了自己在應用端的產品優勢——
讓Composer直接在與用戶相同的環境中運行,真正做到貼合開發者的日常工作流程。
Cursor,你真的是自研嗎?
話說回來,Composer的效果確實很驚艷,但Cursor似乎在故意回避一個問題——
強化學習沒問題,但模型底子你倒是說清楚啊。
Composer的透明度缺失簡直離譜。他們提到用了強化學習,但沒交代模型的其他訓練過程——
到底是自己預訓練的,還是拿現成模型改的?
在他們公開更多細節、或有人能獨立復現結果之前,我對這些說法都持保留態度。
![]()
Cursor研究員Sasha Rush這些天也一直在 Hacker News 上親自答疑,但對于「基礎模型來源」這個問題,她始終沒正面回應。
當被直接問到 「Composer是不是微調自某個開源模型?」 時,Rush的回答是:
我們的主要關注點在于強化學習的后訓練階段,我們認為這是使模型成為強大的交互式智能體的最佳途徑。
不過可以確定的是,Cursor過去確實有自己的內部模型。
據悉,Cheetah是Composer的早期原型,團隊曾用它來測試生成速度與系統集成效果。
不過嘛,正式版Composer到底是基于Cheetah,還是從開源模型的骨架上改的……
還需要讓子彈再飛一會兒~
[1]https://news.ycombinator.com/item?id=45748725
[2]https://simonwillison.net/2025/Oct/29/cursor-composer/
[3]https://venturebeat.com/ai/vibe-coding-platform-cursor-releases-first-in-house-llm-composer-promising
[4]https://cursor.com/cn/blog/2-0
[5]https://x.com/srush_nlp/status/1983572683355725869
[6]https://x.com/cursor_ai/status/1983567619946147967





京公網安備 11011402013531號