
出品|
作者|張瑩
從5月15日至今,豆包大模型已經(jīng)正式發(fā)布了七個(gè)月。
在七個(gè)月前的春季火山引擎原動(dòng)力大會(huì)上,字節(jié)跳動(dòng)正式發(fā)豆包大模型家族,并宣布大語(yǔ)言模型價(jià)格以厘計(jì)算;七個(gè)月后的冬季原動(dòng)力大會(huì)上,豆包視覺理解模型正式發(fā)布并公布定價(jià),視覺理解模型也進(jìn)入厘時(shí)代。
截至12月中旬,豆包通用模型的日均tokens(模型處理的基本數(shù)據(jù)單位)使用量已超過4萬(wàn)億,較七個(gè)月前首次發(fā)布時(shí)增長(zhǎng)了33倍。
在大會(huì)期間的群訪中,火山引擎總裁譚待對(duì)等媒體談到了多個(gè)齊頭并進(jìn)。
首先是2C、2B 齊頭并進(jìn)。“因?yàn)橄電蕵芬幚硇畔ⅲ@取知識(shí)要處理信息,處理工作要處理信息,企業(yè)自己運(yùn)轉(zhuǎn)也要處理信息。”
此外,譚待指出,從 B 端角度,現(xiàn)在大家說(shuō)的 Agent(智能體) 其實(shí)是不夠的。譚待認(rèn)為 Agent 的價(jià)值在于能輔助人多長(zhǎng)時(shí)間的工作。如果輔助人一分鐘的工作,比如寫打油詩(shī),價(jià)值不大。如果能輔助一個(gè)人幾個(gè)小時(shí)的工作,比如說(shuō)教育,這個(gè)價(jià)值是比較大的。
譚待還表示,大模型跟過去所有的技術(shù)不一樣,過去的技術(shù) 2C 端跟 2B 端是割裂的,但是大模型不一樣,大模型的 C 端和 B 端背后是同一個(gè)東西,就是模型本身。
近期,字節(jié)跳動(dòng)發(fā)布了首款A(yù)I智能體耳機(jī)Ola Friend,該款耳機(jī)接入字節(jié)跳動(dòng)旗下豆包大模型。同時(shí),百鏡大戰(zhàn)也頻繁被提及。
談到AI在硬件方面的落地時(shí),譚待提出了第二個(gè)齊頭并進(jìn),“物理、虛擬是齊頭并進(jìn)的。”
他解釋道,“物理世界也是服務(wù)于人的,服務(wù)于人就要和人打交道,聽覺、語(yǔ)言、視覺都要做,這些事以前其實(shí)做不好,但是大模型可以做好。”
對(duì)于競(jìng)爭(zhēng),譚待指出,自己現(xiàn)在不太關(guān)心競(jìng)爭(zhēng),大模型這個(gè)市場(chǎng)還在很早期的階段,可能這個(gè)市場(chǎng)千分之一剛剛開發(fā)出來(lái),要關(guān)心用戶的需求有哪些沒有被滿足。
以下為對(duì)話精編:
媒體:現(xiàn)在通用語(yǔ)言模型的能力,比如說(shuō)能對(duì)話,目前的市場(chǎng)需求是否是有限的?今年的調(diào)用量增長(zhǎng)比較迅猛,后面會(huì)持續(xù)嗎?
譚待:對(duì)話是一個(gè)很通用的場(chǎng)景,但是實(shí)際上大模型本身在很多場(chǎng)景,特別是生產(chǎn)力的場(chǎng)景(需求)也會(huì)非常大。聊天機(jī)器人的聊天是很基礎(chǔ)的功能,加上深度推理的、圖像視覺理解等各種各樣的功能,才能處理更復(fù)雜的任務(wù)。而能解鎖更多復(fù)雜任務(wù)的才是模型未來(lái)發(fā)展空間越來(lái)越大的前提。
媒體:您提到 chat(聊天) 本身是一個(gè)相對(duì)基礎(chǔ)的功能,現(xiàn)在大家行業(yè)都在講所謂的全能 AI 助手,您會(huì)認(rèn)為它是一個(gè)偏同質(zhì)化的階段嗎?
譚待:“理念”大家肯定都是同質(zhì)的,但做不做得到是另外一回事。從 B 端角度,現(xiàn)在大家說(shuō)的 Agent 其實(shí)是不夠的,我覺得 Agent 的價(jià)值在于能輔助人多長(zhǎng)時(shí)間的工作,如果輔助人是一分鐘的工作,比如說(shuō)幫你寫首打油詩(shī),那這個(gè)價(jià)值就不大。如果能輔助一個(gè)人幾個(gè)小時(shí)的工作,比如說(shuō)教育,幫你端到端地完整地教育、輔導(dǎo)作業(yè),這個(gè)價(jià)值是比較大的。我覺得今年還沒有誰(shuí)能做到,明年會(huì)有一些突破。
媒體:最近中國(guó)電信在發(fā)一些大模型的產(chǎn)品,市場(chǎng)競(jìng)爭(zhēng)對(duì)手變多,火山引擎在大模型或者 2B 怎么更好地發(fā)力,展現(xiàn)火山引擎的優(yōu)勢(shì)?
譚待:這個(gè)市場(chǎng)還在很早期的階段,可能這個(gè)市場(chǎng)千分之一剛剛開發(fā)出來(lái)。這個(gè)時(shí)候其實(shí)不用關(guān)心競(jìng)爭(zhēng)的問題,關(guān)心的是用戶的需求有哪些沒有被滿足。比如說(shuō)視覺之前都沒有滿足好,模型又不好用,價(jià)錢又貴,我們這次推出來(lái)后希望一次做到位,這樣大家就能用起來(lái),用起來(lái)就有更多的反饋、更多的創(chuàng)新。
媒體:字節(jié)跳動(dòng) 2C 的產(chǎn)品活躍度也比較高,您覺得大模型的未來(lái)是在 2B 市場(chǎng)還是在 2C 市場(chǎng)?
譚待:就我們的數(shù)據(jù)來(lái)看,在工作、娛樂、生產(chǎn)力的場(chǎng)景其實(shí)是差不多的,所以我覺得大模型就是 2C 和 2B 齊頭并進(jìn),因?yàn)閵蕵芬幚硇畔ⅲ@取知識(shí)要處理信息,處理工作要處理信息,企業(yè)自己運(yùn)轉(zhuǎn)也要處理信息。
媒體:現(xiàn)在也有人在談 AI 眼鏡,您怎么看AI在智能硬件落地的可能性?
譚待:前面提到 2C、2B 齊頭并進(jìn),物理、虛擬也是齊頭并進(jìn)。物理世界也是服務(wù)于人的,服務(wù)于人就要和人打交道,聽覺、語(yǔ)言、視覺都要做,這些事以前其實(shí)做不好,但是大模型可以做好,所以我覺得大模型比過去的很多技術(shù)都更容易連接數(shù)字世界和物理世界。
媒體:9 月之后有幾家國(guó)內(nèi)公司都有提到自己在做推理模型這方面,字節(jié)在推理模型這塊有沒有布局?目前的進(jìn)展如何?
譚待:肯定有布局。今天我們的(產(chǎn)品)雖然沒有叫這個(gè)名字(推理模型),但是我們有些能力已經(jīng)具備雛形了,比如說(shuō)數(shù)學(xué)、物理、代碼。我們還是做得比較完善了再推出,大家敬請(qǐng)期待,不會(huì)太久。
媒體:今年大模型帶動(dòng)了多少公有云的收入,有沒有達(dá)到預(yù)期?
譚待:我現(xiàn)在不看帶動(dòng)多少云的收入,看的是有多少客戶用了我們大模型以及用得有多深。從這個(gè)角度來(lái)說(shuō),我覺得做得還是可以的,我們?cè)谡麄€(gè)市場(chǎng)份額上都做到了比較大的領(lǐng)先。
媒體:這次 OpenAI 的發(fā)布會(huì)可以看得出來(lái) OpenAI 從以前的技術(shù)標(biāo)桿導(dǎo)向型,逐漸往應(yīng)用型發(fā)展。 OpenAI 這種標(biāo)桿企業(yè)已經(jīng)往應(yīng)用端走,是不是說(shuō)明大模型發(fā)展遇到了瓶頸?
譚待:我覺得 OpenAI 是一個(gè)做技術(shù)和做應(yīng)用都非常棒的公司。大模型什么時(shí)候火的?GPT 論文已經(jīng)發(fā)了好幾年了也沒那么火,是因?yàn)榘?ChatGPT 這個(gè)產(chǎn)品做出來(lái)了,大家用了以后覺得太棒了。所以O(shè)penAI一開始其實(shí)就是做應(yīng)用,而且做得還不錯(cuò)。但后面因?yàn)殡S著模型的提升,能解決的問題越來(lái)越多,應(yīng)用的形態(tài)要發(fā)生變化。我始終認(rèn)為技術(shù)和應(yīng)用就是齊頭并進(jìn)的。并不存在我把技術(shù)做好,我就是技術(shù)公司。
媒體:SORA 上線后不久 OpenAI 出現(xiàn)了算力不夠用的情況,最近,豆包視頻生成大模型開放后,對(duì)算力的布局如何?
譚待:從我們自己的儲(chǔ)備上我覺得(算力)還是很充足的。此外,新功能上線,用戶使用的時(shí)候出現(xiàn)了卡頓或者阻礙,不一定是算力不夠的原因。畢竟你用的是一個(gè)應(yīng)用,前端、接入端,哪怕用戶驗(yàn)證出了問題,也會(huì)影響到整個(gè)系統(tǒng)的流暢性,這不只是簡(jiǎn)單的算力問題。
媒體:您提到豆包大模型要爭(zhēng)當(dāng)行業(yè)第一,豆包大模型的核心競(jìng)爭(zhēng)力是什么?
譚待:做好模型有很多點(diǎn),算法、人才、數(shù)據(jù)、工程都很重要。如果只說(shuō)一點(diǎn)就是,大模型跟過去所有的技術(shù)不一樣,過去的技術(shù) 2C 端跟 2B 端是割裂的,大家天天刷抖音,但是天天刷抖音是不是會(huì)天天用火山引擎的云?這是沒有必然關(guān)系的。但是大模型不一樣,大模型的 C 端和 B 端背后是同一個(gè)東西,就是模型本身。
有好多人問我企業(yè)怎么做 AI 轉(zhuǎn)型,第一 CEO 自己下個(gè)豆包 APP。以前 2B 很多使用者是分離的,決策者感受不到這個(gè)東西好不好,只能通過聽匯報(bào),聽 PPT。而大模型是第一個(gè)決策者自己可以感受到這個(gè)技術(shù)好不好的。





京公網(wǎng)安備 11011402013531號(hào)