媒體報道,AI通過通用型聊天機(jī)器人和AI編程工具正在改變?nèi)藗兊墓ぷ鞣绞剑瑸镺penAI和微軟等公司的收入帶來增長,各家公司一直在嘗試把員工的工作內(nèi)容交給人工智能代理(AI agents)。
然而,許多企業(yè)在使用更復(fù)雜的AI代理時卻遇到了困難,這些代理往往“勝任不了工作”,因此AI提供商不得不親自介入、與客戶一起排查問題,避免AI“搞砸事情”。
例如,歐洲零售商Fnac在使用AI客服代理時遇到困難。Fnac曾測試過OpenAI、Google和其他實(shí)驗(yàn)室的模型,但效果不佳。該公司首席數(shù)字與電商負(fù)責(zé)人Olivier Theulle對媒體表示,可靠性是個問題:當(dāng)顧客反饋產(chǎn)品有缺陷時,AI要求顧客提供產(chǎn)品序列號,但卻把這些序列號與其他產(chǎn)品的序列號混淆了,而這些序列號僅有一位數(shù)字不同。
Fnac每年?duì)I收達(dá)100億美元。Theulle說,直到與以色列公司AI21 Labs達(dá)成合作,并獲得其工程師的協(xié)助后,這個AI代理的表現(xiàn)才開始變得穩(wěn)定。AI21聯(lián)合CEO Ori Goshen說,
“問題在于,模型開箱即用時在各類基準(zhǔn)測試上表現(xiàn)很好,但在真實(shí)企業(yè)環(huán)境中表現(xiàn)并不好。”
“需要進(jìn)行相當(dāng)程度的定制化。”
一些公司對媒體表示,只有在自家軟件工程師花上數(shù)月時間部署AI代理,并從AI公司那里獲得直接技術(shù)支持后,他們才能真正從中受益。如今,科技公司領(lǐng)導(dǎo)者也表示,企業(yè)不能指望在沒有AI廠商“手把手扶持”的情況下,讓復(fù)雜AI項(xiàng)目順利運(yùn)行。
風(fēng)投Vinod Khosla在10月接受媒體采訪時表示,
“這就像說‘我們有輛賽車,任何人都能開’,但普通人根本無法發(fā)揮賽車的最大性能。”
Khosla是OpenAI的早期投資者,最近又投資了一家AI咨詢初創(chuàng)公司,該公司向T-Mobile等企業(yè)派駐工程師,幫助他們在大型組織內(nèi)落地AI。這家初創(chuàng)公司Distyl只是眾多在該領(lǐng)域崛起的公司之一,它們?yōu)樾枰С值钠髽I(yè)提供高科技咨詢服務(wù)。OpenAI、Anthropic、Salesforce和Snowflake等AI開發(fā)商和AI代理提供商也開始招聘前線部署工程師(FDEs)或推出類似咨詢服務(wù),但這往往會提高他們的成本。
另一個例子則是專為汽車經(jīng)銷商提供軟件、年銷售額90億美元的Cox Automotive。此前該公司開發(fā)一個AI代理,用于為經(jīng)銷商制作營銷網(wǎng)頁。由于該公司是亞馬遜云服務(wù)AWS在汽車領(lǐng)域的最大客戶之一,所以得到了“白手套式的服務(wù)”。
Cox首席產(chǎn)品官M(fèi)arianne Johnson對媒體表示,AWS工程師和為該代理提供AI技術(shù)的Anthropic工程師飛到Cox位于亞特蘭大的總部,與Cox的軟件開發(fā)人員并肩工作了數(shù)天共同構(gòu)建這個工具。她拒絕透露Cox為此向AWS和Anthropic支付了多少費(fèi)用,但估計未來數(shù)年可節(jié)省數(shù)百萬美元的人力成本,因?yàn)楣緹o需再人工為客戶制作網(wǎng)站。
“它很自信地胡說八道”
AI代理的目標(biāo)是處理客戶服務(wù)問題、管理IT系統(tǒng)等各種任務(wù)。AI和云服務(wù)提供商正在押注企業(yè)使用AI代理帶來的收入,將其作為未來一兩年投入數(shù)千億美元建設(shè)AI數(shù)據(jù)中心的理由。
但這些供應(yīng)商以及部分客戶高管表示,AI代理太難配置,而且行為常常不可預(yù)測。這使得它們無法用于那些一旦出錯就會造成嚴(yán)重后果的任務(wù)。因此客戶降低了預(yù)期,不再奢望AI代理能自動化太多工作,并暫緩在客戶支持和網(wǎng)絡(luò)安全等關(guān)鍵崗位部署AI代理。
例如,IT服務(wù)巨頭Kyndryl今年開始測試微軟的Security Copilot,這是一款聊天機(jī)器人,旨在對接企業(yè)IT系統(tǒng),用簡單英語解釋潛在安全漏洞,相當(dāng)于自動化網(wǎng)絡(luò)安全分析師的工作。但負(fù)責(zé)公司內(nèi)部網(wǎng)絡(luò)安全的Scott Owenby對媒體表示,當(dāng)Kyndryl員工嘗試詢問一些基礎(chǔ)問題,比如“哪些公司設(shè)備運(yùn)行的是過期軟件”時,Security Copilot給出的答案明顯是錯誤的。Owenby說,
“它信心滿滿地胡說八道,而我佩服這種自信,但我無法相信它的數(shù)據(jù)。”
Kyndryl花了約5萬美元測試了Security Copilot六個月,之后決定停止使用這款軟件。Owenby說,
“我基本上是把5萬美元燒了。這不算多,如果哪怕有一點(diǎn)用我們都會繼續(xù)用,但我們沒想到它居然完全沒法用。”
Owenby還說,其他AI工具效果更好,例如Palo Alto Networks的軟件可以自動處理網(wǎng)絡(luò)安全中重復(fù)繁瑣的工作,例如調(diào)查員工從新地點(diǎn)登錄或截取敏感數(shù)據(jù)截圖的情況。這使得他過去一年減少了部分安全團(tuán)隊(duì)的人手,但他表示仍然需要工作人員監(jiān)控這些AI工具,而不能完全讓AI全權(quán)執(zhí)行。
“有些炒作成分”
博世電動工具(Bosch Power Tools)年?duì)I收超57億美元。該公司數(shù)字客戶體驗(yàn)負(fù)責(zé)人Florian Haustein對媒體表示,公司一年多以來一直在測試一款聊天機(jī)器人,用于回答客戶關(guān)于工具使用方式和故障排查的問題。
但Haustein表示,這款聊天機(jī)器人仍然經(jīng)常給出錯誤答案,一些錯誤答案甚至可能導(dǎo)致用戶受傷。因此,該項(xiàng)目仍停留在試點(diǎn)階段。他還表示,博世正在測試Google、OpenAI等多家實(shí)驗(yàn)室的模型。
Haustein對媒體說,博世在另一個不那么激進(jìn)的客服聊天機(jī)器人上收效更好,該機(jī)器人只回答更基礎(chǔ)的問題,例如在哪可以買到某款產(chǎn)品;還有一款由SAP提供的AI工具能讀取客戶咨詢內(nèi)容,并自動分配給合適的人類員工。Haustein說,
“我認(rèn)為‘完全用AI做客服’有些炒作。”
“你必須確保答案接近100%準(zhǔn)確……但我們?nèi)匀豢吹交糜X和錯誤答案。我認(rèn)為我們還沒有達(dá)到能夠完全自動化所需要的信心水平。”
一些技術(shù)供應(yīng)商也承認(rèn)AI代理還未成熟。亞馬遜CEO Andy Jassy在上周四的財報電話會上說:
“現(xiàn)階段,構(gòu)建AI代理仍比想象中困難。”
“但隨著時間推移,企業(yè)從AI中實(shí)現(xiàn)的很多價值將來自AI代理。”
AI代理產(chǎn)品收入難計算
目前,通用聊天機(jī)器人、編程助手、AI搜索和AI視頻生成工具的采用,已經(jīng)幫助工程、市場和產(chǎn)品管理團(tuán)隊(duì)提升了效率,企業(yè)高管們對媒體表示。
這推動了AI供應(yīng)商的新收入增長:根據(jù)媒體的生成式AI數(shù)據(jù)庫,由OpenAI和Anthropic引領(lǐng)的20家AI原生初創(chuàng)公司,每年因AI辦公用途獲得的年化收入已達(dá)230億美元,而三年前幾乎為零。
但要單獨(dú)計算“AI代理”帶來的收入?yún)s很困難。在Google、微軟和亞馬遜等云公司,大部分收入增長來自O(shè)penAI、Anthropic和meta等大型AI開發(fā)商租用服務(wù)器,而非企業(yè)類AI應(yīng)用。
在出售AI代理的企業(yè)軟件公司中,結(jié)果不一。Salesforce今年早些時候表示,其Agentforce產(chǎn)品(用于自動化銷售郵件、跟蹤發(fā)票等任務(wù))年收入超過1億美元。ServiceNow則稱,其用于自動處理IT服務(wù)工單的AI軟件,有望在2026年底前實(shí)現(xiàn)10億美元收入。但這兩家公司的收入增長最近幾個季度都比2023年大多數(shù)時間慢。
SAP尚未單獨(dú)公布AI產(chǎn)品收入,但CEO Christian Klein在本月的財報電話中表示,AI將在未來兩年帶來“雙位數(shù)收入增長”。
許多提供AI代理的軟件公司,包括Salesforce、Snowflake和Xero,目前甚至沒有對這類產(chǎn)品收費(fèi),他們希望等客戶真正認(rèn)可價值之后再收費(fèi)。
ServiceNow全球客戶運(yùn)營總裁Paul Fipps對媒體表示,近期客戶在試點(diǎn)AI功能方面不再那么興奮,因?yàn)樗麄冏兊酶蝇F(xiàn)實(shí),開始考慮AI代理究竟能合理自動化哪些任務(wù)。Fipps說,
“在過去12到18個月里,由于生成式AI的發(fā)展速度太快,很多客戶積極試點(diǎn)這些AI能力,鐘擺被推到了極端的一側(cè)。”
“現(xiàn)在你看到鐘擺開始回擺。”
他仍然樂觀,認(rèn)為隨著AI代理不斷進(jìn)步,未來幾年企業(yè)會繼續(xù)大力投入。
目前,AI代理在軟件開發(fā)領(lǐng)域最成功。AI編程代理正成為許多公司工程團(tuán)隊(duì)的標(biāo)配。但軟件工程師仍需檢查AI的代碼,因?yàn)锳I會犯錯,意味著任務(wù)還不能完全自動化。
“保持現(xiàn)實(shí)”
Palo Alto Networks首席執(zhí)行官Nikesh Arora表示,銷售AI工具的公司必須謹(jǐn)慎,不要過度承諾AI能自動化多少工作。他認(rèn)為,網(wǎng)絡(luò)安全崗位要實(shí)現(xiàn)完全自動化仍需數(shù)年。
“我們保持現(xiàn)實(shí)的態(tài)度,(完全自動化)需要更多努力,我們必須非常確定,當(dāng)把操作交給AI時,它采取的行動是正確的,因?yàn)榫W(wǎng)絡(luò)安全是有后果的。”
盡管如此,公司仍然認(rèn)可AI代理帶來的收益,即使需要“有人看著”。例如,加拿大太陽馬戲團(tuán)Cirque du Soleil正在使用SAP提供的一款A(yù)I代理,追蹤其服裝和舞臺布景供應(yīng)商的發(fā)票。
當(dāng)供應(yīng)商發(fā)郵件詢問發(fā)票狀態(tài)時,AI代理會檢查SAP系統(tǒng)中發(fā)票是否處理完畢,并草擬回復(fù)郵件。過去,該公司有兩名全職員工做這件事;現(xiàn)在,這兩人已被安排到其他部門,只需一人審核AI草稿再發(fā)出即可。
該工具的運(yùn)營成本低于一名全職員工的薪資,副總裁Philippe Lalumière對媒體說:
“有時候AI寫的郵件不太禮貌,但供應(yīng)商得到回復(fù)更快、更清楚,所以整體滿意度更高。我們沒有因?yàn)樗脝T,但生產(chǎn)力提升很明顯。”
與此同時,其他AI代理供應(yīng)商也提醒客戶,要把這些工具視為實(shí)驗(yàn)性項(xiàng)目,而不是能立即帶來回報的投資。
微軟核心AI產(chǎn)品開發(fā)總裁Asha Sharma上周在The Information的WTF峰會上表示:
“把AI代理視為研發(fā)預(yù)算……一種將在未來5到10年見效的投資。”
“我認(rèn)為我們還處在非常早期階段……我們現(xiàn)在有數(shù)百萬個AI代理投入生產(chǎn)使用,但大家仍然在摸索如何讓AI代理真正有用。”





京公網(wǎng)安備 11011402013531號