整理 | 華衛(wèi)、核子可樂(lè)
4 月 30 日凌晨,meta 舉行了其有史以來(lái)的首屆 AI 開(kāi)發(fā)者大會(huì) LlamaCon。現(xiàn)場(chǎng),該公司宣布推出一款面向消費(fèi)者的獨(dú)立 meta AI 聊天機(jī)器人應(yīng)用程序,這款應(yīng)用將與 ChatGPT 展開(kāi)競(jìng)爭(zhēng),同時(shí)還發(fā)布了一個(gè)面向開(kāi)發(fā)者的 API,用于在云端訪問(wèn) Llama 模型。
這兩項(xiàng)產(chǎn)品發(fā)布都旨在擴(kuò)大 meta 開(kāi)源 Llama AI 模型的應(yīng)用范圍,但這一目標(biāo)或許只是次要的,meta 的真正動(dòng)機(jī)是:擊敗 OpenAI。從大致方向來(lái)看,meta 的 AI 野心正推動(dòng)形成一個(gè)蓬勃發(fā)展的開(kāi)源 AI 生態(tài)系統(tǒng),而這將對(duì)像 OpenAI 這樣將其模型封閉在服務(wù)背后的“封閉式” AI 供應(yīng)商構(gòu)成挑戰(zhàn)。
首先,meta AI 應(yīng)用幾乎像是對(duì) OpenAI 傳聞中要推出的社交網(wǎng)絡(luò)的先發(fā)制人之舉。作為一款智能助手,meta AI 基于 Llama 模型構(gòu)建,集成了圖像生成和編輯功能,可以了解用戶(hù)的偏好、記住上下文,能根據(jù)用戶(hù)在應(yīng)用程序上的活動(dòng)提供個(gè)性化回復(fù)。到目前為止,這些個(gè)性化回復(fù)功能將在美國(guó)和加拿大地區(qū)提供。用戶(hù)還可以向 meta 提供更多關(guān)于自己的信息,以便在未來(lái)與 AI 對(duì)話時(shí)能被記住。

meta 表示,該應(yīng)用能夠從現(xiàn)有的 AI 助手中脫穎而出,因?yàn)樗梢?“利用你已經(jīng)選擇在 meta 產(chǎn)品上分享的信息”,比如個(gè)人資料以及所關(guān)注的內(nèi)容。并且,該應(yīng)用支持語(yǔ)音和文本交互,還額外支持全雙工語(yǔ)音交互(允許在接收語(yǔ)音的同時(shí)并行處理和響應(yīng),支持邊聽(tīng)邊說(shuō)、實(shí)時(shí)打斷等功能)。現(xiàn)在,meta AI 還是 AI 眼鏡產(chǎn)品的配套應(yīng)用程序, meta View 用戶(hù)可以繼續(xù)通過(guò)該應(yīng)用程序管理其 AI 眼鏡。
此外,meta AI 應(yīng)用引入了一個(gè)“探索動(dòng)態(tài)”(Discover feed)板塊,這是一個(gè)分享和探索其他人如何使用 AI 的地方。只有在用戶(hù)選擇分享的情況下,他們與 meta 人工智能的互動(dòng)內(nèi)容才會(huì)出現(xiàn)在這個(gè)動(dòng)態(tài)板塊中。這個(gè)動(dòng)態(tài)板塊可能會(huì)放大某些生成式人工智能的流行趨勢(shì),比如最近人們嘗試讓自己看起來(lái)像芭比娃娃或吉卜力工作室動(dòng)畫(huà)角色的潮流。不過(guò)話說(shuō)回來(lái),并非每個(gè)應(yīng)用程序都需要有社交動(dòng)態(tài)板塊。

至于 Llama API,這似乎是另一項(xiàng)對(duì) OpenAI API 業(yè)務(wù)的挑戰(zhàn)。據(jù)介紹,Llama API 的設(shè)計(jì)初衷是讓開(kāi)發(fā)者能夠更輕松地構(gòu)建與云端 Llama 模型相連接的應(yīng)用程序,只需使用一行代碼即可實(shí)現(xiàn)。它消除了依賴(lài)第三方云服務(wù)提供商來(lái)運(yùn)行 Llama 模型的需求,并為 AI 開(kāi)發(fā)人員提供更全面的一系列工具。
從今天開(kāi)始,meta 將提供 Llama API 的限量免費(fèi)試用版,預(yù)計(jì)在未來(lái)幾周或幾個(gè)月內(nèi)向更多用戶(hù)推出該工具。該公司表示:“你在 Llama API 上構(gòu)建的模型歸你所有,可以將它們部署到任何你想托管的地方,我們不會(huì)把它們鎖定在我們的服務(wù)器上。” meta 還指出,Llama API 不會(huì)使用用戶(hù)提示和模型響應(yīng)來(lái)訓(xùn)練自己的模型。

不管出于何種原因,meta 似乎樂(lè)于啟動(dòng)那些能夠強(qiáng)化開(kāi)源模型生態(tài)系統(tǒng)并限制 OpenAI 發(fā)展的 AI 發(fā)布計(jì)劃,有時(shí)甚至以自身無(wú)法推出尖端模型為代價(jià)。除此之外,meta 可能還試圖推廣其開(kāi)源模型,以滿(mǎn)足監(jiān)管方面的額外規(guī)定。據(jù)了解,《歐盟人工智能法案》給予了那些分發(fā)“免費(fèi)且開(kāi)源”AI 系統(tǒng)的公司特殊待遇。
在 LlamaCon 召開(kāi)之前,幾位 AI 研究人員曾希望 meta 能發(fā)布一款像 OpenAI 的 o3-mini 那樣具有競(jìng)爭(zhēng)力的推理模型。但該公司最終并未這樣做。對(duì) meta 來(lái)說(shuō),似乎并不一定是要贏得人工智能競(jìng)賽。而長(zhǎng)期以來(lái),削弱像 OpenAI 這樣的專(zhuān)有 AI 模型供應(yīng)商一直是 meta AI 戰(zhàn)略的核心。
在今年 1 月一樁針對(duì) meta 的人工智能版權(quán)案中,解封的內(nèi)部信息顯示,負(fù)責(zé) meta 人工智能業(yè)務(wù)的高管和研究人員在開(kāi)發(fā) Llama 3 模型期間,一心想著要超越 OpenAI 的 GPT-4 模型。2024 年 7 月的一封信中,meta 創(chuàng)始人兼 CEO 馬克·扎克伯格 (Mark Zuckerberg)試圖將 meta 與 OpenAI 這樣的公司區(qū)分開(kāi)來(lái),他寫(xiě)道:“出售對(duì) AI 模型的訪問(wèn)權(quán)限并非(meta 的)商業(yè)模式。”
扎克伯格在與 Databricks 首席執(zhí)行官阿里·戈德西(Ali Ghodsi)的臺(tái)上對(duì)話中表示,他將任何公開(kāi)提供其模型的人工智能實(shí)驗(yàn)室都視為對(duì)抗封閉式模型供應(yīng)商的盟友,包括 DeepSeek 和阿里巴巴的 Qwen。
“開(kāi)源的部分價(jià)值在于可以進(jìn)行組合搭配。因此,如果另一個(gè)模型(如 DeepSeek)更好,或者 Qwen 更擅長(zhǎng)某項(xiàng)工作,那么開(kāi)發(fā)人員就有能力從不同模型中汲取最優(yōu)秀的智能部分,并生產(chǎn)出所需要的東西。這就是我認(rèn)為開(kāi)源在質(zhì)量上基本上會(huì)超越所有閉源(模型)的部分原因……這感覺(jué)就像是一股勢(shì)不可擋的力量。”扎克伯格說(shuō)道。
據(jù) meta 透露,其 Llama 模型系列的下載量已達(dá)到 12 億次下載,由 Llama 提供支持的 meta AI 助手已覆蓋約 10 億用戶(hù)。“我們有數(shù)千名開(kāi)發(fā)人員貢獻(xiàn)了數(shù)萬(wàn)個(gè)衍生模型,每月下載數(shù)十萬(wàn)次。”meta 首席產(chǎn)品官克里斯·考克斯(Chris Cox)在主題演講中說(shuō)。
而就開(kāi)源和閉源兩種模型生態(tài)在當(dāng)下的演進(jìn)、各自的優(yōu)勢(shì)以及如何協(xié)同使用,扎克伯格與微軟 CEO 薩蒂亞·納德拉(Satya Nadala)在 LlamaCon 現(xiàn)場(chǎng)進(jìn)行了一場(chǎng)深度的技術(shù)討論。對(duì)話中,兩人還互曝了 meta 和微軟內(nèi)部當(dāng)前各自采用 AI 做研發(fā)的實(shí)際比例,并大談了關(guān)于“蒸餾工廠”的設(shè)想和各自接下來(lái)促成這件事的分工。
以下是經(jīng)翻譯和編輯后不改變?cè)獾膶?duì)話內(nèi)容:
“相比閉源,
開(kāi)源有巨大結(jié)構(gòu)性?xún)?yōu)勢(shì)”
Satya Nadala:Mark,我記得最早一次見(jiàn)你是我 2008 年在 Bing 工作時(shí),你還給我上了一課,讓我印象深刻。當(dāng)時(shí)你提醒我犯了一個(gè)錯(cuò)誤,想想還挺尷尬的。我一直都記得,你說(shuō)“網(wǎng)絡(luò)依附于人,要多體現(xiàn)人的要素”。我永遠(yuǎn)都記得這一點(diǎn),就像你可以在任何地方都有個(gè)人主頁(yè)。這對(duì)我來(lái)說(shuō)是段很重要的回憶。
Mark Zuckerberg:很高興你能原諒我那次的批評(píng),不過(guò)從整體上來(lái)講,網(wǎng)絡(luò)確實(shí)離不開(kāi)人。所以我想那時(shí)候我的觀點(diǎn)大體是對(duì)的。但也許現(xiàn)在更偏向于智能體了,可以說(shuō)是雙路并進(jìn)吧。你多次提到當(dāng)前 AI 關(guān)鍵技術(shù)時(shí)刻與過(guò)去的一些重大技術(shù)變革類(lèi)似,比如從客戶(hù)端 - 服務(wù)器架構(gòu)到 Web 初期的轉(zhuǎn)變等。我很好奇,你是怎么看的?
Satya Nadala:我個(gè)人當(dāng)時(shí)正好經(jīng)歷了客戶(hù)端計(jì)算剛剛興起的時(shí)期。我加入微軟的時(shí)候正值 Windows 3.0 發(fā)布之后,所以親眼見(jiàn)證了客戶(hù)端 - 服務(wù)器架構(gòu)的誕生,接著是 Web、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算,而現(xiàn)在算是第四或第五次平臺(tái)級(jí)變革了吧。有趣的是,每一次技術(shù)平臺(tái)的轉(zhuǎn)變,整個(gè)技術(shù)棧都會(huì)被重新審視一遍,我們需要回歸最初的原則并重新開(kāi)始建設(shè)。
比如說(shuō),就連我自己在 2007、2008 年左右構(gòu)建的云基礎(chǔ)設(shè)施的核心存儲(chǔ)系統(tǒng),也不具備如今模型訓(xùn)練這類(lèi)工作負(fù)載所需要的存儲(chǔ)結(jié)構(gòu)。數(shù)據(jù)并行同步的負(fù)載模式與 Hadoop 等其他傳統(tǒng)系統(tǒng)截然不同。每次平臺(tái)發(fā)生巨變時(shí),都需要從下至上徹底重構(gòu)整個(gè)技術(shù)棧,我認(rèn)為這就是永遠(yuǎn)需要面對(duì)的挑戰(zhàn)。Web 起源于 Windows,但它早已超越了這個(gè)起點(diǎn)。這也是我對(duì)此的看法。
Mark Zuckerberg:很有道理。你之前也多次強(qiáng)調(diào),隨著效率提升,系統(tǒng)的運(yùn)作方式會(huì)發(fā)生變化,并促使用戶(hù)對(duì)服務(wù)的消費(fèi)大幅上升。我有點(diǎn)好奇的是,你們身處企業(yè)市場(chǎng)核心業(yè)務(wù)之中,而我們?cè)谶@方面的感知沒(méi)那么深。我好奇在這些 AI 模型周?chē)銈冇^察到了哪些變化趨勢(shì)?是不是覺(jué)得每一代模型都在變得更高效、將智能水平推向新高度?顯然,這一切都發(fā)生得太快了,所以我還不太清楚你們的體會(huì)。
Satya Nadala:仔細(xì)想想,幾年前我們還在討論摩爾定律是否終結(jié)的問(wèn)題。而如今,我們正處在一個(gè)類(lèi)似“超光速”發(fā)展的階段。事實(shí)上,技術(shù)平臺(tái)的每一次重大轉(zhuǎn)變都不是單線式,而是多線式疊加形成的復(fù)合增長(zhǎng)。比如芯片本身就在進(jìn)步,黃仁勛和蘇姿豐等人在硬件創(chuàng)新上的貢獻(xiàn)極大提高了迭代速度。我們可以說(shuō)這是摩爾定律的延續(xù),但除此之外,還有基礎(chǔ)設(shè)施優(yōu)化、系統(tǒng)軟件改進(jìn)、模型架構(gòu)調(diào)優(yōu)、推理內(nèi)核優(yōu)化、應(yīng)用服務(wù)器優(yōu)化、提示詞 緩存機(jī)制等。所有這些因素疊加在一起,使得每 6 到 12 個(gè)月就能帶來(lái)約十倍的整體性能提升。當(dāng)能力提升如此迅速、成本下降如此之快時(shí),本質(zhì)上就會(huì)帶來(lái)消費(fèi)量的激增。
因此,我非常樂(lè)觀地認(rèn)為,我們正站在一個(gè)可以構(gòu)建深度應(yīng)用程序的階段。如果回顧第一代的應(yīng)用,它們往往只綁定單個(gè)模型;但現(xiàn)在我們終于進(jìn)入多模型應(yīng)用時(shí)代,我可以據(jù)此總結(jié)出一個(gè)確定性的流程:通過(guò)智能體構(gòu)建一個(gè)應(yīng)用,這個(gè)智能體又可以接入其他模型。我們甚至已經(jīng)有了一些有用的協(xié)議(如 MCP、A to N 等),只要我們能逐步標(biāo)準(zhǔn)化這些協(xié)議,就可以構(gòu)建出既強(qiáng)大又靈活的應(yīng)用。而在這個(gè)過(guò)程中,開(kāi)源絕對(duì)可以發(fā)揮巨大作用。
Mark Zuckerberg:那咱們深入探討一下如何協(xié)同使用多個(gè)模型吧。我注意到你提到了“蒸餾工廠”的概念和相關(guān)的基礎(chǔ)設(shè)施建設(shè)。你覺(jué)得微軟在這方面是否具備優(yōu)勢(shì)?我們可以稍后再聊這個(gè)問(wèn)題。但在此之前,我想先聊聊你們最近在開(kāi)源領(lǐng)域的探索。這也是你早期領(lǐng)導(dǎo)下的一個(gè)重要轉(zhuǎn)折點(diǎn)。你們一開(kāi)始與 OpenAI 建立了早期合作關(guān)系,但同時(shí)也明確表示除了支持閉源模型外,也要為開(kāi)源模型提供良好的服務(wù)。我想了解一下,你是如何看待開(kāi)源生態(tài)的演進(jìn)的?這對(duì)你的客戶(hù)為何如此重要?你們?cè)谡麄€(gè)基礎(chǔ)設(shè)施建設(shè)中又為什么要選取這樣的方向?
Satya Nadala:這是個(gè)很有趣的問(wèn)題。事實(shí)上,我在微軟早年的一項(xiàng)關(guān)鍵工作,就是確保我們的 NT 系統(tǒng)能夠與各種 Unix 版本保持互操作性。這段經(jīng)歷讓我明白了一件事:互操作性是客戶(hù)的需求,如果你做得好,不僅有利于客戶(hù),也有利于你的業(yè)務(wù)。因此,我對(duì)開(kāi)源的態(tài)度并不是出于某種教條主義之爭(zhēng)。無(wú)論是閉源還是開(kāi)源,在這個(gè)世界里都有其必要性。而且最終,是客戶(hù)決定了他們需要什么。即使我們內(nèi)部有人堅(jiān)持某一種立場(chǎng),現(xiàn)實(shí)世界也不會(huì)以個(gè)人意志為轉(zhuǎn)移。
舉個(gè)例子,SQL Server、MySQL、PostgreSQL、Linux、Windows 其實(shí)都共存已久。甚至 Linux 也能運(yùn)行在 Windows 上,我個(gè)人最喜歡用的就是 WSL(Windows Subsystem for Linux)。它讓開(kāi)發(fā)者可以輕松地將大量開(kāi)發(fā)工具部署到 Windows 上。總體而言,我認(rèn)為最好的選擇就是同時(shí)支持這兩種生態(tài)系統(tǒng)。這也契合你剛才談到的觀點(diǎn):很多企業(yè)客戶(hù)希望蒸餾出屬于自己的模型,因?yàn)槟鞘撬麄兊闹R(shí)產(chǎn)權(quán)所在。在這樣的場(chǎng)景下,開(kāi)源模型相比閉源模型具有巨大的結(jié)構(gòu)性?xún)?yōu)勢(shì)。
因此,我認(rèn)為目前最好的狀態(tài)是:既有強(qiáng)大的閉源前沿模型,也有優(yōu)秀的開(kāi)源前沿模型。對(duì)于我們這種主流云服務(wù)提供商來(lái)說(shuō)是一件好事。畢竟,我們?cè)?Azure 上既可以提供出色的 Postgres、SQL Server,也可以提供 Linux 或 Windows 虛擬機(jī)。我們要做的就是提供選擇權(quán)以及配套的強(qiáng)大工具鏈。
Mark Zuckerberg:那你覺(jué)得你們?cè)陂_(kāi)源領(lǐng)域到底扮演著怎樣的角色?也不一定非得局限于開(kāi)源,而是面向開(kāi)發(fā)者群體,尤其是在他們起步階段,你們希望在哪些方面體現(xiàn)差異化或優(yōu)勢(shì)?
Satya Nadala:首先,AI 工作負(fù)載遠(yuǎn)不止一塊加速器芯片和一個(gè)推理模型那么簡(jiǎn)單。現(xiàn)實(shí)情況是,每一個(gè) AI 應(yīng)用背后都離不開(kāi)存儲(chǔ)、計(jì)算資源和網(wǎng)絡(luò)的支持。因此,底層基礎(chǔ)設(shè)施依然是重中之重。對(duì)于我們來(lái)說(shuō),無(wú)論是在亞洲還是全球范圍,我們都要打造世界級(jí)的 IaaS 層,把計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)和 AI 加速器整合起來(lái),服務(wù)于那些想要構(gòu)建下一代智能體的用戶(hù)。在此之上,我們也正在構(gòu)建 Foundry 這樣的應(yīng)用服務(wù)器。
例如,每個(gè)平臺(tái)變遷時(shí)期,都會(huì)有相應(yīng)的應(yīng)用服務(wù)器出現(xiàn)。問(wèn)題是:如何將搜索、內(nèi)存管理、安全、評(píng)估等功能打包成一套完整的工具集?我們認(rèn)為這就是核心所在。此外,我們還特別專(zhuān)注于 GitHub Copilot 這一類(lèi)開(kāi)發(fā)輔助工具。我們對(duì)它的進(jìn)展感到非常振奮。因此,我認(rèn)為要加速應(yīng)用開(kāi)發(fā),必須依靠強(qiáng)大的工具鏈、強(qiáng)大的應(yīng)用服務(wù)器和強(qiáng)大的基礎(chǔ)設(shè)施。
AI 帶來(lái)的生產(chǎn)力提升
Mark Zuckerberg:你剛才提到了“智能體”和“生產(chǎn)力提升”,這顯然是整個(gè)生態(tài)和社區(qū)的重要主題之一。我很想知道在微軟內(nèi)部,你們目前是怎么應(yīng)用這些技術(shù)的?有哪些特別有趣的案例可以分享?
Satya Nadala:我覺(jué)得對(duì)我們最有啟發(fā)的是軟件開(kāi)發(fā)領(lǐng)域的變化。以 GitHub Copilot 為例,最開(kāi)始它只提供代碼補(bǔ)全功能,后來(lái)又加入了聊天功能,意味著用戶(hù)不再需要切換到 Reddit 或 Stack Overflow,而可以在 IDE 中始終保持上下文連貫。再往后引入了基于智能體的工作流,你可以直接給模型分配任務(wù)。這三個(gè)功能雖然層層遞進(jìn),但并沒(méi)有相互替代。現(xiàn)在我們有了 Proto-3 類(lèi)似的智能體原型,你可以直接給出高層次指令,或者把 Pull Request 分配給 SWE Agent 處理。在這四個(gè)層級(jí)上帶來(lái)的生產(chǎn)力提升,最關(guān)鍵的經(jīng)驗(yàn)是:必須把這些新技術(shù)無(wú)縫集成到現(xiàn)有的代碼倉(cāng)庫(kù)和開(kāi)發(fā)流程中。
新建一個(gè)空白項(xiàng)目當(dāng)然不錯(cuò),但現(xiàn)實(shí)中我們很少有機(jī)會(huì)完全從零開(kāi)始。我們面對(duì)的是龐大的代碼庫(kù)和復(fù)雜的流程體系,這就要求我們必須集成工具鏈。而這正是所有工程團(tuán)隊(duì)必須完成的系統(tǒng)性工作,當(dāng)我們真正做到這點(diǎn)時(shí),生產(chǎn)力才會(huì)真正顯現(xiàn)出來(lái)。不僅是在開(kāi)發(fā)領(lǐng)域,對(duì)知識(shí)工作者同樣適用。比如在銷(xiāo)售工作中,一種典型流程是準(zhǔn)備客戶(hù)會(huì)議。自從 1992 年我加入微軟以來(lái),準(zhǔn)備這類(lèi)會(huì)議的方式幾乎就沒(méi)變過(guò):有人寫(xiě)份報(bào)告,通過(guò)郵件或文檔發(fā)給你,你前一晚讀完。現(xiàn)在我只需要打開(kāi) Copilot Researcher,就能實(shí)時(shí)獲取來(lái)自互聯(lián)網(wǎng)、公司內(nèi)部系統(tǒng)甚至 CRM 數(shù)據(jù)的綜合信息。這完全改變了流程——不再需要人為準(zhǔn)備材料,因?yàn)橐磺卸伎梢约磿r(shí)獲取,但這也意味著工作成果和流程本身必須改變。這種變化起初緩慢,但一旦突破臨界點(diǎn),就會(huì)迅速普及。PC 技術(shù)的普及過(guò)程就是這樣。我想過(guò)在電子郵件和 EXCEL 互操作之前,世界是如何做預(yù)測(cè)的。你知道,傳真到處都是。我猜你從沒(méi)經(jīng)歷過(guò)那樣的世界。
Mark Zuckerberg:當(dāng)時(shí)我還在上初中,但你說(shuō)得沒(méi)錯(cuò)。
Mark Zuckerberg:說(shuō)到編程效率的提升,你估計(jì)目前微軟內(nèi)部有多少比例的代碼是由 AI 編寫(xiě)的?或者說(shuō)是由工程師主導(dǎo)、AI 協(xié)助完成的?
Satya Nadala:我們主要看兩個(gè)指標(biāo):一個(gè)是用戶(hù)的接受率,大概在 30% 到 40%,而且呈持續(xù)上升趨勢(shì)。不同的編程語(yǔ)言表現(xiàn)不一,比如 Python 適配度最好,C# 也不錯(cuò),但 C++ 目前還沒(méi)那么成熟。隨著語(yǔ)言支持度的提升,代碼補(bǔ)全質(zhì)量也在提高。而在“代理式編程”方面,目前更多適用于全新項(xiàng)目,在已有項(xiàng)目中使用較少。因此目前來(lái)看,可能有 20% 到 30% 的代碼已經(jīng)由 AI 完成,甚至有些項(xiàng)目完全是 Sophia 寫(xiě)的。你們那邊呢?
Mark Zuckerberg:我手上其實(shí)并沒(méi)有確切的數(shù)字,但我認(rèn)為,我們看到的很多采用數(shù)據(jù)本質(zhì)上還只是類(lèi)似于“自動(dòng)補(bǔ)全”這種功能。不過(guò),我們內(nèi)部有很多團(tuán)隊(duì)正在做一些“推薦排序”或者“廣告排序”這樣的實(shí)驗(yàn)。這些都是邊界非常清晰的具體領(lǐng)域,在這里面我們可以研究歷史上的所有改動(dòng)記錄,并據(jù)此進(jìn)行迭代。我認(rèn)為這個(gè)方向挺有意思的。但對(duì)我們來(lái)說(shuō)更重要的目標(biāo)是:利用 AI 和機(jī)器學(xué)習(xí)來(lái)推動(dòng) Llama 系列模型的研發(fā)本身。因?yàn)槲磥?lái)一年內(nèi),可能有一半的工作都會(huì)由 AI 而不是人類(lèi)完成,而且這一比例只會(huì)越來(lái)越高。所以剛才聽(tīng)你說(shuō)到微軟的情況,我覺(jué)得很有趣。
Satya Nadala:是的。在我們這邊,三大智能體(Researcher、Analyst 和 Copilot)可以說(shuō)是我們?cè)谶@條路上邁出的第一步。現(xiàn)在的問(wèn)題是,明年我們能不能實(shí)現(xiàn)類(lèi)似“內(nèi)核優(yōu)化”這樣級(jí)別的能力?在我看來(lái),比起設(shè)計(jì)出全新的模型結(jié)構(gòu),我們更有可能在具體任務(wù)上取得突破。關(guān)鍵還是要看我們?cè)谀男┤蝿?wù)上優(yōu)先發(fā)力。
Mark Zuckerberg:沒(méi)錯(cuò),像性能優(yōu)化、安全增強(qiáng)這類(lèi)任務(wù),我覺(jué)得成功的可能性就很高。而且,我們也在嘗試解決一個(gè)不同的問(wèn)題——你們主要服務(wù)于開(kāi)發(fā)者和工程師群體,這也算是你們的核心業(yè)務(wù)。而對(duì)我們來(lái)說(shuō),更多是想提升 meta 自身的研發(fā)效率,并繼續(xù)改進(jìn) Llama 系列模型,讓其他公司也能用得上。我們不會(huì)像你們那樣完整地構(gòu)建端到端的開(kāi)發(fā)流程,所以我一直很好奇你會(huì)怎么看待這件事。
Satya Nadala:從我們的角度來(lái)看,核心業(yè)務(wù)是從工具的角度出發(fā)的。比爾·蓋茨當(dāng)年創(chuàng)立這家公司時(shí),打造的就是一家工具供應(yīng)商。現(xiàn)在我們考慮的是,也許應(yīng)該重新定義“工具”的概念。換句話說(shuō),未來(lái)的工具其實(shí)就是一套為智能體服務(wù)的基礎(chǔ)設(shè)施。即便是“三大智能體”也需要配合一系列工具,那么它們應(yīng)該是什么樣的?它們的基礎(chǔ)設(shè)施和沙盒機(jī)制又該如何設(shè)計(jì)?我們接下來(lái)要做的,很大程度上是在 GitHub 代碼倉(cāng)庫(kù)這樣的系統(tǒng)上進(jìn)行演化,比如針對(duì) SWE Agent 做適配性調(diào)整。
Mark Zuckerberg:沒(méi)錯(cuò),這確實(shí)是個(gè)很有意思的概念。我也傾向于認(rèn)為,未來(lái)的每一個(gè)工程師實(shí)際上都會(huì)變成某種意義上的技術(shù)負(fù)責(zé)人,他們手下會(huì)有“自己的小團(tuán)隊(duì)”,也就是一批他們調(diào)教過(guò)的 AI 智能體來(lái)協(xié)助工作。另外,剛才你說(shuō)起你在個(gè)人使用 AI 過(guò)程中的變化,我還挺好奇的,你是怎么看待這個(gè)問(wèn)題的?還有一點(diǎn)也蠻有意思,就是你之前介紹了微軟早期是如何轉(zhuǎn)型做 AI 的。其實(shí)我一直有個(gè)問(wèn)題:如果今天有位新手程序員打算開(kāi)始構(gòu)建點(diǎn)東西,你覺(jué)得他們會(huì)怎樣去選擇適合自己的開(kāi)發(fā)工具呢?
Satya Nadala:這個(gè)問(wèn)題非常重要。我記得最早大家常常會(huì)討論一些基本的問(wèn)題,比如蓋茨曾經(jīng)啟發(fā)我們思考:“文檔、應(yīng)用和網(wǎng)頁(yè)之間到底有什么區(qū)別?”他總是把這個(gè)問(wèn)題講得很深?yuàn)W,比如說(shuō),到底是什么區(qū)分了文檔、應(yīng)用和網(wǎng)站?現(xiàn)在來(lái)看,如果你使用 meta AI、ChatGPT 或者 Copilot 之類(lèi)的工具,你會(huì)發(fā)現(xiàn)“聊天對(duì)話”和“頁(yè)面操作”之間的界限其實(shí)并不清晰。舉個(gè)例子,我自己最近就在研究 Llama 4 的相關(guān)資料,我把所有信息都通過(guò)聊天的方式整理出來(lái),然后保存成文檔格式。接著,我可以直接基于這段內(nèi)容寫(xiě)代碼,甚至生成一個(gè)完整的應(yīng)用。
這就是我想表達(dá)的關(guān)鍵點(diǎn)之一:你可以從一個(gè)宏觀意圖出發(fā),最終產(chǎn)出一個(gè)動(dòng)態(tài)的內(nèi)容載體——在過(guò)去,我們會(huì)稱(chēng)它為“應(yīng)用程序”。這種轉(zhuǎn)變會(huì)對(duì)整個(gè)開(kāi)發(fā)流程產(chǎn)生深遠(yuǎn)影響。我們現(xiàn)在正站在變革的起點(diǎn),這也是我的夢(mèng)想所在。作為工具的設(shè)計(jì)者和使用者,我們過(guò)去所劃分的那些類(lèi)別界限——不管是人為設(shè)定的還是由于軟件限制而形成的——將來(lái)可能會(huì)被徹底打破,或者說(shuō)被重新定義。
還有一個(gè)我們以前經(jīng)常思考的問(wèn)題:為什么 Word、Excel 和 PowerPoint 是三個(gè)獨(dú)立的東西?為什么它們不能合并為一個(gè)整體?雖然我們過(guò)去嘗試過(guò)多次整合,但直到現(xiàn)在才真正具備這個(gè)可能性。比如你可以在同一個(gè)工作流里先輸入一段文字,接著把它可視化成表格,再以 PPT 的形式展示,而所有這一切都可以存儲(chǔ)在一個(gè)統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)中。對(duì)我來(lái)說(shuō),這才是真正的可塑性和靈活性的體現(xiàn),而這在以前是很難實(shí)現(xiàn)的。
Mark Zuckerberg:是的,這很有趣也非常合理。回想這些年我們的對(duì)話,我覺(jué)得你對(duì)技術(shù)趨勢(shì)的理解方式始終都很理性。面對(duì)當(dāng)前鋪天蓋地的 AI 熱潮,你總能看穿表象,做出非常理性的判斷和投資決策。你曾提到的一個(gè)觀點(diǎn)讓我印象很深:盡管現(xiàn)在炒得火熱,但歸根結(jié)底,只有當(dāng) AI 真的帶來(lái)生產(chǎn)力的爆發(fā)式增長(zhǎng),才能反映在 GDP 的顯著提升上。而這一過(guò)程可能需要好幾年甚至更長(zhǎng)時(shí)間才會(huì)顯現(xiàn)成效。我想知道你現(xiàn)在如何看待這些問(wèn)題:我們應(yīng)該關(guān)注哪些指標(biāo)來(lái)衡量 AI 的發(fā)展進(jìn)度?在未來(lái) 3 至 7 年的時(shí)間里,你預(yù)計(jì)它會(huì)發(fā)展到什么程度?
Satya Nadala:這個(gè)問(wèn)題問(wèn)得很好。對(duì)我們來(lái)說(shuō),AI 的意義已經(jīng)不僅僅是技術(shù)升級(jí),而是關(guān)乎人類(lèi)社會(huì)生存與發(fā)展的根本問(wèn)題。我們需要一種新的生產(chǎn)要素來(lái)應(yīng)對(duì)大量現(xiàn)實(shí)挑戰(zhàn)。最好的類(lèi)比可能就是工業(yè)革命時(shí)期的經(jīng)濟(jì)增長(zhǎng),當(dāng)時(shí)發(fā)達(dá)國(guó)家的增長(zhǎng)率一度達(dá)到 10% 左右。想要實(shí)現(xiàn)類(lèi)似的突破,就必須在各行各業(yè)大幅提升生產(chǎn)力,包括醫(yī)療、零售和廣泛的知識(shí)型工作。AI 當(dāng)然具備這樣的潛力,但關(guān)鍵在于我們要讓它真正釋放出可觀的生產(chǎn)力提升。這不僅需要軟件層面的創(chuàng)新,也需要組織管理和流程上的深度重構(gòu)。
因?yàn)槟撤N程度上,人們必須改變與技術(shù)互動(dòng)的方式。就像電力剛出現(xiàn)的時(shí)候一樣,在最初半個(gè)世紀(jì)內(nèi),人們并沒(méi)有意識(shí)到它可以徹底改變工廠的運(yùn)作方式。福特汽車(chē)公司就是一個(gè)經(jīng)典案例。我們現(xiàn)在正處在類(lèi)似的中間階段。我希望這個(gè)過(guò)程不要半世紀(jì)那么久,但我同時(shí)也認(rèn)為,僅僅把 AI 當(dāng)作“不用馬的馬車(chē)”并不是通往未來(lái)的正確思路。這不只是技術(shù)的進(jìn)步,而是要把這套新能力融入整個(gè)社會(huì)和企業(yè)的運(yùn)作體系中,創(chuàng)造出全新的工作模式和成果形態(tài)。
Mark Zuckerberg:確實(shí),我們都正在下注,賭這事不會(huì)花上半個(gè)世紀(jì)。我也確實(shí)希望不需要那么久。
“蒸餾工廠”的設(shè)想
Mark Zuckerberg:剛才我們已經(jīng)討論了不少技術(shù)層面的問(wèn)題,接下來(lái)也該說(shuō)點(diǎn)宏觀的了。我突然意識(shí)到我們漏掉了一個(gè)關(guān)鍵話題——關(guān)于“蒸餾工廠”的設(shè)想,以及你打算如何整合各種為開(kāi)源而打造的不同 AI 模型,并構(gòu)建支持這種整合所需的基礎(chǔ)設(shè)施。這顯然是你之前經(jīng)常提到的重要方向之一。
Satya Nadala:對(duì)我來(lái)說(shuō),“蒸餾工廠”正是我認(rèn)為開(kāi)源最重要的作用之一:能夠從一個(gè)大模型出發(fā),比如你們 Llama 家族內(nèi)的某個(gè)大模型,然后將其提煉成一個(gè)更加小巧但結(jié)構(gòu)一致的模型。我覺(jué)得這是一個(gè)非常有潛力的應(yīng)用場(chǎng)景。因此,圍繞這個(gè)過(guò)程來(lái)構(gòu)建工具鏈和平臺(tái)服務(wù)、降低使用門(mén)檻,是我們未來(lái)需要重點(diǎn)推動(dòng)的方向。
如你所說(shuō),部署這些大模型本身需要龐大的基礎(chǔ)設(shè)施,不是所有人都有能力或者有必要去親力親為。但如果把它放在云平臺(tái)上,再輔以易用的工具和輸出結(jié)果,比如對(duì)于每一個(gè) Microsoft 365 的租戶(hù)來(lái)說(shuō),如果他們都能生成一個(gè)任務(wù)專(zhuān)用的小型蒸餾模型,并可以作為智能體或工作流調(diào)用,甚至可以直接在 Copilot 中觸發(fā)——這就意味著真正的突破。目前人們已經(jīng)在做類(lèi)似的事,但我們想讓它變得更簡(jiǎn)單。
我所說(shuō)的“蒸餾工廠”,是指那種由一到多的關(guān)系,也就是一個(gè)大模型可以生成多個(gè)蒸餾后的小模型,并將它們嵌入像 GitHub Copilot 這樣的產(chǎn)品內(nèi)部流程中,與 MCP 服務(wù)器等現(xiàn)有機(jī)制配合調(diào)用其他智能體。
Mark Zuckerberg:沒(méi)錯(cuò),我一直對(duì)這個(gè)方向很著迷。我認(rèn)為蒸餾是開(kāi)源生態(tài)系統(tǒng)中最強(qiáng)大的能力之一。而且正如我們各自的角色分工,我們主要負(fù)責(zé)訓(xùn)練最初的 Llama 模型,但開(kāi)發(fā)者基礎(chǔ)設(shè)施這塊不是我們自己主導(dǎo)。所以我一直覺(jué)得,像你們這樣愿意投入建設(shè)復(fù)雜基礎(chǔ)設(shè)施的企業(yè)就顯得特別重要。我們也在做一個(gè)體量龐大的模型,但說(shuō)實(shí)話,除了通過(guò)蒸餾把它壓縮成更實(shí)用的形式,我真不知道該怎么直接拿來(lái)用了。連我們自己要使用它,都需要先搭建大量?jī)?nèi)部系統(tǒng),光是進(jìn)行后續(xù)訓(xùn)練就需要不少前置條件。在多數(shù)隨機(jī)場(chǎng)景下根本跑不起來(lái)。
Satya Nadala:你說(shuō)的應(yīng)該是 Maverick 吧?
Mark Zuckerberg:對(duì),基本全靠蒸餾出來(lái)的 Maverick 小模型。我們能實(shí)現(xiàn)現(xiàn)在這樣的性能表現(xiàn),很大程度上是因?yàn)樗嵌嗄B(tài)的,在文本處理方面表現(xiàn)突出,而且模型規(guī)模又比別的小。比如 DeepSeek 雖然更大,但在文本能力上跟 Maverick 差不多,而在圖像和多模態(tài)方面,只有 Maverick 具備這些能力,別的模型還不行。
這一切的背后,其實(shí)都源于我們完成了那個(gè)巨大模型的預(yù)訓(xùn)練,現(xiàn)在正在進(jìn)行后續(xù)訓(xùn)練。但真正讓我們獲得實(shí)效的其實(shí)是蒸餾過(guò)程,簡(jiǎn)直就像是魔法一樣。你可以做到幾乎保留原模型 90% 到 95% 的能力,體量卻縮小到原本的 1/20。這樣成本更低、效率更高,更適合實(shí)際應(yīng)用。問(wèn)題是,如何讓沒(méi)有足夠資源和技術(shù)積累的人也能用上這套東西?因?yàn)槟壳叭蚍秶鷥?nèi),能做到這類(lèi)蒸餾工作的實(shí)驗(yàn)室還非常有限。但如果我們能把你的愿景落地,讓大多數(shù)開(kāi)發(fā)者都能方便地訪問(wèn)這些工具,不僅限于從單一模型蒸餾,還能在未來(lái)逐步實(shí)現(xiàn)跨模型的知識(shí)組合和靈活調(diào)用,那將會(huì)是非常酷的一件事。
Satya Nadala:完全同意。所以接下來(lái)我們要解決的問(wèn)題包括:如果你同時(shí)從多個(gè)模型中提取知識(shí),那你如何評(píng)估并確認(rèn)蒸餾后的模型質(zhì)量?這方面就是我們可以在工具和基礎(chǔ)設(shè)施層面上發(fā)力的地方,目的就是降低靈活性使用的門(mén)檻。
好消息是,這件事其實(shí)已經(jīng)開(kāi)始起步了。已經(jīng)有案例證明這條路可以跑通,問(wèn)題只是能不能把整個(gè)門(mén)檻降得更低一些。另外還有一個(gè)挑戰(zhàn)是響應(yīng)速度。比如我現(xiàn)在用一個(gè)模型做微調(diào),可剛調(diào)好就有新的樣本數(shù)據(jù)出來(lái)了,我必須快速切換到新樣本。如果我們不能保持敏捷,就會(huì)被快速變化的技術(shù)節(jié)奏甩在后面。
Mark Zuckerberg:此外,開(kāi)發(fā)者們也需要不同形式的產(chǎn)品形態(tài)。舉個(gè)例子,Llama 4 之所以設(shè)計(jì)成每個(gè)專(zhuān)家模塊 170 億參數(shù)的結(jié)構(gòu),是因?yàn)?meta 這邊的基礎(chǔ)計(jì)算單元是 H100 顯卡。我們希望能在這種硬件上運(yùn)行得盡可能高效。但你會(huì)發(fā)現(xiàn),有些其他開(kāi)源模型雖然性能不錯(cuò),但由于模型規(guī)模的原因,在推理階段反而不夠友好,可能更適合別的硬件架構(gòu)。我們主要是面向服務(wù)器端生產(chǎn)環(huán)境優(yōu)化的,但很多開(kāi)源社區(qū)用戶(hù)其實(shí)想要更輕量級(jí)的模型。比如最受大家歡迎的 Llama 3 就是 8B 版本,所以我們也會(huì)考慮推出更小的版本。
我之前也提到了這點(diǎn)。我們內(nèi)部稱(chēng)之為“小 Llama”,至于最終會(huì)不會(huì)發(fā)布還有待觀察。但關(guān)鍵是,只要能把大模型中的智能抽取出來(lái),并按需蒸餾成適合筆記本、手機(jī)或者其他設(shè)備運(yùn)行的形態(tài),我覺(jué)得這就是一件非常重要的事情。哪怕我自己都說(shuō)不清楚到底有多重要,但我就是相信它的價(jià)值。
Satya Nadala:我明白。我知道你們?cè)谶@方面一直積極推進(jìn)。也深深為此感到高興。如果我們能進(jìn)一步走向“混合模型”的時(shí)代,比如 MoE(混合專(zhuān)家)加上思維鏈模型,就可以通過(guò)靈活配置來(lái)調(diào)節(jié)延遲或推理時(shí)間,到時(shí)候我們將真正進(jìn)入一個(gè)更加靈活和可控的 AI 發(fā)展階段。我想這正是我們所有人的共同目標(biāo)。
Mark Zuckerberg:贊成!既然談到這里,我想我們可以用一個(gè)問(wèn)題給今天的對(duì)話畫(huà)上句號(hào)。當(dāng)你看看眼下這一切,你最感到樂(lè)觀的是什么?或者說(shuō),在接下來(lái)幾年里,你最期待開(kāi)發(fā)者們能做些什么?
Satya Nadala:這么說(shuō)吧,我總是會(huì)想起鮑勃·迪倫的那句歌詞:“你要么忙著出生,要么忙著死去。” 在當(dāng)前這個(gè)時(shí)代,我們顯然應(yīng)該選擇前者,努力讓自己不斷進(jìn)化和成長(zhǎng)。讓我感到樂(lè)觀的是,盡管存在種種限制,軟件——尤其是以 AI 新形態(tài)呈現(xiàn)的軟件——依然是我們手中最具可塑性的資源,是我們解決各類(lèi)難題的關(guān)鍵工具。這給了我信心。我也認(rèn)為,這應(yīng)該成為我們所有人行動(dòng)的號(hào)召:抓住機(jī)會(huì)深入?yún)⑴c其中,同時(shí)積極構(gòu)建解決方案。
無(wú)論是企業(yè) IT 系統(tǒng)里的需求積壓,還是現(xiàn)實(shí)世界中尚未解決的難題,它們都需要全新的思路和方法。而我認(rèn)為,這就是這項(xiàng)技術(shù)最大的價(jià)值所在。歸根結(jié)底,這還是要落到開(kāi)發(fā)者身上——只有他們才能毫無(wú)畏懼地沖在前面,把這些可能性變成現(xiàn)實(shí)。
Mark Zuckerberg:感謝 Satya,也感謝各位的到來(lái)。今天真是令人振奮的一天,我也將繼續(xù)對(duì)大家未來(lái)共同構(gòu)建的一切充滿(mǎn)期待。
參考鏈接:
https://techcrunch.com/2025/04/29/metas-llamacon-was-all-about-undercutting-openai/
https://about.fb.com/news/2025/04/introducing-meta-ai-app-new-way-access-ai-assistant/
https://techcrunch.com/2025/04/29/meta-launches-a-standalone-ai-app-to-compete-with-chatgpt/
https://www.youtube.com/watch?v=FZ-RZ0dKO8o
聲明:本文為 整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。





京公網(wǎng)安備 11011402013531號(hào)