金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
全球最快的開源大模型來了——速度達到了每秒2000個tokens!
雖然只有320億參數(32B),吞吐量卻是超過典型GPU部署的10倍以上的那種。
![]()
它就是由阿聯酋的穆罕默德·本·扎耶德人工智能大學(MBZUAI)和初創公司G42 AI合作推出的K2 Think。
名字是不是有點熟悉?
沒錯,它和月之暗面前不久推出的Kimi K2在命名上是有點小撞車,不過阿聯酋這個多了個“Think”。
但非常有意思的一點是,在K2 Think的背后,確實有“made in China”的味道。
因為從HuggingFace中的Model tree來看,K2 Think是基于Qwen 2.5-32B打造的:
![]()
而且“全球最快開源AI模型”之外,MBZUAI官方還稱自家的K2 Think是“有史以來最先進的開源 AI 推理系統”。
那么它的實力到底幾何?我們繼續往下看。
實測速度均超過2000 tokens/秒
目前,K2 Think已經給出了可以體驗的地址(見文末)。
我們先小試牛刀測試一把IMO的試題:
Let a_n = 6^n + 8^n. Determine the remainder when dividing a_{83} by 49.

可以肉眼看到,在沒有任何加速的情況下,K2 Think在思考過后輸出答案的速度,真的就是“啪的一下”。
從底部給出的速度來看,已經達到了2730.4 tokens/秒。
![]()
接下來,我們用中文來測試一個經典問題:
Strawberry這個單詞里面有幾個字母R?

速度依舊保持在了2224.7 tokens/秒,并且給出了正確答案:3個R。
![]()
我們再來實測幾道AIME 2025的數學題:
Find the sum of all integer bases $b>9$ for which $17_{b}$ is a divisor of $97_{b}$.
![]()
Find the number of ordered pairs $(x,y)$, where both $x$ and $y$ are integers between $-100$ and $100$, inclusive, such that $12x^{2}-xy-6y^{2}=0$.
![]()
可以看到,K2 Think最大特點就是所有問題均能保持在超過2000 tokens/秒的速度,并且就目前實測結果來看,生成的答案均是正確。
但從功能角度來看,目前K2 Think還不支持文檔傳輸,以及多模態等能力。
不過MBZUAI的高級研究員Taylor W. Killian在X上也給出了解釋:
這個模型主要為數學推理而開發。
![]()
技術報告也已發布
從體量上來看,K2 Think僅有32B,但官方卻表示,它已經可以與OpenAI和DeepSeek旗艦推理模型的性能相當。
![]()
從測試結果來看,K2 Think在多項數學基準測試中,拿下了較為理想的分數,例如AIME’24 90.83分、AIME’25 81.24分、HMMT25 73.75分,以及Omni-MATH-HARD上取得60.73分的成績。
![]()
并且K2 Think團隊已經發布技術報告:
![]()
從整體來看,K2 Think團隊主要從六個方面做到了技術創新:
![]()
長鏈路思維的監督微調(SFT):通過精心設計的鏈式推理數據,訓練模型逐步思考,而不是直接給答案,使其在復雜問題上更有條理。可驗證獎勵的強化學習(RLVR):模型不是依賴人類偏好打分,而是直接以答案對錯為獎勵信號,顯著提升數學、邏輯等領域的表現。推理前的智能規劃(Plan-Before-You-Think):先讓一個規劃代理提煉問題要點,制定解題大綱,再交給模型展開詳細推理,就像人類先列提綱再解題一樣。推理時擴展(Best-of-N采樣):對同一問題生成多個答案,再挑選最佳結果,從而提高正確率。推測解碼(Speculative Decoding):在推理時并行生成和驗證答案,減少冗余計算,加速輸出。硬件加速(Cerebras WSE晶圓級引擎):依托全球最大的單芯片計算平臺,實現單請求每秒超2000 tokens的生成速度,使長鏈路推理也能保持流暢的交互體驗。
與此同時,研究團隊還對K2 Think進行了系統的安全測試,包括拒絕有害請求、多輪對話魯棒性、防止信息泄露和越獄攻擊等,整體達到了較高水平。
![]()
那么你也想嘗鮮一下目前世界最快開源AI模型的速度嗎?鏈接放下面嘍,感興趣的小伙伴快去體驗吧~
體驗地址:
https://www.k2think.ai/
技術報告:
https://k2think-about.pages.dev/assets/tech-report/K2-Think_Tech-Report.pdf
參考鏈接:
[1]https://www.k2think.ai/k2think
[2]https://x.com/mbzuai/status/1965386234559086943
[3]https://huggingface.co/LLM360/K2-Think
[4]https://venturebeat.com/ai/k2-think-arrives-from-uae-as-worlds-fastest-open-source-ai-model
[5]https://www.youtube.com/watch?v=8C6_B1QeyBo





京公網安備 11011402013531號