Anthropic周一推出其旗艦AI模型的最新版本Claude Opus 4.5,稱該模型在軟件工程方面比以往版本更強,能更好地執行自動化編程和辦公任務。分析稱,這是Anthropic爭奪企業客戶而在與OpenAI和谷歌競爭中的又一步動作。
Claude Opus 4.5是Anthropic在兩個月內發布的第三個重要模型,再次展示了AI行業的發展速度之快。該公司在9月底推出了Claude Sonnet 4.5,10月又發布了Claude Haiku 4.5。
Anthropic表示,Claude Opus 4.5可以更自主地修復程序錯誤,而不需要用戶介入,還被設計成能更好地在用戶的電腦和互聯網上執行復雜的多步驟任務。
Anthropic開發者關系負責人Alex Albert對媒體表示:
“在我們真正關注的那些任務中,這是世界上最智能的模型。”
“我們的主題就是以極高的速度推進,并不斷推出我們所能做到的最好的模型。”
Claude Opus 4.5將在所有地區上線,并成為Anthropic Pro、Max和Enterprise全線產品的默認模型。
新模型編程能力突出
Anthropic在博客中表示,這款新模型在廣受歡迎的編程測試集SWE-Bench Verified上的得分超過了Google Gemini 3 Pro和OpenAI的GPT 5.1。
![]()
新模型在處理日常任務方面“顯著更強”。在“代理式編程”(agentic coding)方面,Claude Opus 4.5也達到了行業領先水平,根據軟件能力評測集SWE-bench Verified的結果,它的表現優于Gemini 3 Pro,以及OpenAI的GPT-5.1。
![]()
根據Claude AI模型產品負責人Scott White的說法,Anthropic的新模型在某種意義上達到了新的編程里程碑。Opus 4.5是第一款在公司內部一項具有挑戰性的“居家工程任務”測試中,得分超過所有公司應聘工程師求職者的模型。White沒有透露這個任務的具體內容,但表示這是一個需要合格求職者花費數小時完成的測評任務,而且任務本身也會使用Anthropic的Claude模型。
White對媒體表示:
“現在,它已經達到一個拐點,我們必須重新思考如何評估軟件工程能力。”
White表示,Claude Opus 4.5的理想用戶包括專業軟件開發人員、金融分析師、咨詢顧問以及會計師等知識型工作者。他補充說,那些“渴望提升自身創造力、打造新產品、擴大專業能力范圍”的用戶也會覺得這款模型很有用。
他表示,新模型還能更好地處理金融分析、制作演示文稿和電子表格等任務。此外,Opus 4.5更適合與用戶進行來回協作,不只是簡單生成一個用戶再去自行打磨的粗稿。
Anthropic也將在微軟Excel中向企業客戶和其高端Max訂閱用戶提供Opus 4.5。Excel中的聊天功能允許用戶指示Claude聊天機器人執行諸如編輯電子表格等操作。此前,這項功能僅在受邀測試的用戶中提供。
其他產品更新
除了模型發布,Anthropic周一還宣布了一系列其他產品和功能更新。
該公司表示,其瀏覽器擴展Claude for Chrome(可以讓 Claude 在不同瀏覽器標簽頁之間執行操作)將向所有Max用戶開放。Claude for Excel(能理解并編輯電子表格)也將向所有Max、Team和Enterprise用戶全面開放。
Anthropic還將Claude Code引入桌面應用,并為其開發者平臺加入新功能。
企業編程領域模型采用率領先
Anthropic由前OpenAI員工于2021年在舊金山創立,目前已有超過30萬家企業客戶使用其模型來簡化工作流程。尤其是在計算機編程領域,該公司已經成為市場領先者之一。微軟和英偉達上周宣布對Anthropic進行數十億美元投資,使其估值提升至約3500億美元。
該公司最知名的產品是一系列名為Claude的AI模型。它通過不斷增加編號來區分不同代際,但系列里最大的模型通常稱為Opus,專為高級推理和復雜問題求解而打造;中等規模的稱為Sonnet,最小的稱為Haiku,兩者則主要優化速度和效率。Anthropic最近一次發布的Opus型號是在8月,名為Claude Opus 4.1。
但Anthropic面臨來自OpenAI和谷歌的激烈競爭。谷歌上周發布了Gemini 3,新模型在編碼等任務上表現更強。
今年7月,Menlo Ventures的報告指出,Anthropic目前在企業級AI采用率方面處于領先,占據32%的市場份額。OpenAI以25%排第二,相比兩年前幾乎腰斬;谷歌為20%,meta以9%排第四。





京公網安備 11011402013531號