?耐力驚人!Anthropic 旗艦?zāi)Ｐ?Claude Opus4.5創(chuàng)下“長(zhǎng)任務(wù)”處理新紀(jì)錄

IP屬地中國(guó)·北京 編輯：鐘景軒 Chinaz 時(shí)間：2025-12-22 12:27:51

在追求大模型“高智商”的同時(shí)，AI 的持續(xù)執(zhí)行能力正成為衡量其進(jìn)化水平的新維度。根據(jù)人工智能研究機(jī)構(gòu)METR發(fā)布的最新基準(zhǔn)測(cè)試，Anthropic 旗下的頂級(jí)模型Claude Opus4.5在處理超長(zhǎng)時(shí)間任務(wù)方面展現(xiàn)出了統(tǒng)治級(jí)實(shí)力。
測(cè)試結(jié)果顯示，Claude Opus4.5在維持50% 成功率的前提下，能夠持續(xù)處理長(zhǎng)達(dá)約 4小時(shí)49分鐘的復(fù)雜任務(wù)，這一表現(xiàn)刷新了行業(yè)歷史記錄。所謂的“時(shí)間分辨率”指標(biāo)，揭示了模型在不同難度挑戰(zhàn)下的耐力邊界:在面對(duì)簡(jiǎn)單任務(wù)（80% 成功率）時(shí)，它僅需27分鐘即可完成;而一旦進(jìn)入高難度、高耗時(shí)的深水區(qū)，Opus4.5的優(yōu)勢(shì)便被無(wú)限放大。
AIbase 注意到，雖然測(cè)試數(shù)據(jù)中出現(xiàn)了模型理論上可連續(xù)工作超過(guò)20小時(shí)的數(shù)值，但METR坦言這可能受限于樣本量較小而產(chǎn)生的誤差。盡管如此，這一突破依然標(biāo)志著 AI 正在從“短指令回復(fù)者”向“長(zhǎng)程項(xiàng)目執(zhí)行者”轉(zhuǎn)型。
然而，也有專(zhuān)家對(duì)該測(cè)試的局限性提出了質(zhì)疑。目前 METR 僅涵蓋了14個(gè)樣本，且有觀(guān)點(diǎn)認(rèn)為這種基準(zhǔn)測(cè)試可能被模型針對(duì)性地“刷分”。但不可否認(rèn)的是，Claude Opus4.5的出現(xiàn)，確實(shí)為需要高強(qiáng)度、長(zhǎng)時(shí)程邏輯支撐的 AGI 任務(wù)提供了新的可能性。

免責(zé)聲明：本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系我們，本站將會(huì)在24小時(shí)內(nèi)處理完畢。

同類(lèi)資訊

PicPak掌上墨水屏相框現(xiàn)身：彩色E-ink屏幕，400天續(xù)航

阿里千問(wèn)發(fā)布“2025十大AI提示詞”：“股票”排名榜首

從文本到生態(tài) 中國(guó)網(wǎng)文出海故事續(xù)新章

阿里千問(wèn)發(fā)布2025十大AI提示詞，“股票”居首

OPPO Find X9 Ultra手機(jī)被曝雙2億影像配置

小米17 Ultra手機(jī)全新配色「星空綠」亮相，12月25日發(fā)布

全站最新

PicPak掌上墨水屏相框現(xiàn)身：彩色E-ink屏幕，400天續(xù)航

阿里千問(wèn)發(fā)布“2025十大AI提示詞”：“股票”排名榜首

從文本到生態(tài) 中國(guó)網(wǎng)文出海故事續(xù)新章

阿里千問(wèn)發(fā)布2025十大AI提示詞，“股票”居首

熱門(mén)推薦

自主品牌BU改革開(kāi)啟，廣汽迎價(jià)值重估拐點(diǎn)？

「海南短劇出海產(chǎn)業(yè)基地」揭牌

零跑汽車(chē)在浙江成立金屬材料公司

千問(wèn)「2025十大AI提示詞」發(fā)布，股票高居榜首

快手電商宣布升級(jí)生鮮返傭政策，覆蓋果蔬肉禽水產(chǎn)全類(lèi)目

優(yōu)必選等在九江成立具身智能技術(shù)公司

機(jī)構(gòu)：TikTok重返巴西應(yīng)用下載榜首

小米Buds 6宣布12月25日發(fā)布

亞馬遜 AGI 部門(mén)換帥:云業(yè)務(wù)老將接棒，力求終結(jié) AI “落后局勢(shì)”

小米17Ultra12月25日發(fā)布全新配色星空綠亮相

?耐力驚人!Anthropic 旗艦?zāi)Ｐ?Claude Opus4.5創(chuàng)下“長(zhǎng)任務(wù)”處理新紀(jì)錄

阿里千問(wèn)發(fā)布 2025 十大 AI 提示詞，?“股票”、“八字”上榜

iQOO Z11 Turbo系列官宣：好看爆能打

OpenAI計(jì)算利潤(rùn)率飆升至70%！內(nèi)部指標(biāo)翻倍，商業(yè)化效率顯著提升

舊金山大停電致Waymo全城“癱瘓”！數(shù)百輛無(wú)人出租車(chē)停擺街頭，暴露自動(dòng)駕駛脆弱性