2月25日,根據新智元報道,Anthropic祭出首個混合推理Claude 3.7 Sonnet,堪稱擴展思考模式的最強模型。在最新編碼測試中,新模型比o3-mini、DeepSeek R1要強上不少,堪稱AI編碼領域新王者。

根據介紹,Claude 3.7 Sonnet是Anthropic推出的首款混合推理模型,也是Claude系列中迄今為止最智能的模型,幾乎能夠及時響應,并進行可擴展的、逐步的思考。

Claude 3.7 Sonnet能夠產生幾乎即時的響應或逐步展示思考過程的詳細步驟,這些步驟對用戶是可見的。API用戶還可以精細控制模型的思考時間。在編碼和前端網頁開發方面,Claude 3.7 Sonnet得到顯著提升。除此之外,他們還推出了一款名為Claude Code的命令行工具,用于智能體編碼。

目前,Claude Code僅作為有限的研究預覽版提供,它使開發人員能夠直接從他們的終端將大量的工程任務委托給Claude。
在多項基準測試中,「擴展思考」模式加持下的Claude 3.7 Sonnet,在數學、物理、指令執行、編程等刷新SOTA。相較于上一代Claude 3.5 Sonnet,數學、編碼能力提升10%以上。除了數學,Claude 3.7 Sonnet(64k extended thinking)幾乎完全碾壓o3-mini,DeepSeek R1,與Grok 3不相上下。可以說,Claude 3.7 Sonnet完全是一個最強“軟件工程AI”。在SWE-bench上,其還創下了70.3%的高分。
值得一提的是,Claude 3.7 Sonnet目前已經在Claude.ai平臺上線,Web、iOS和Android用戶皆可免費體驗。





京公網安備 11011402013531號