21世紀商業(yè)評論

記者丨何己派 編輯丨鄢子為
4萬億,這是豆包通用模型的日均tokens使用量。
從5月首次發(fā)布到12月中旬,這個數(shù)字增長了33倍。
作為字節(jié)跳動發(fā)力AI大模型的核心武器,豆包出場晚、野心大。
為扶其上馬,字節(jié)帶頭掀起行業(yè)第一輪降價潮,同時產(chǎn)品、服務(wù)和生態(tài)快速裂變,充實矩陣。
在12月18日舉辦的火山引擎Force大會上,字節(jié)發(fā)布豆包視覺理解、3D生成等新模型,并公布了一次到位的價格,視覺理解模型千tokens輸入價格,僅為3厘。
按此計算,一元錢就可處理284張720P的圖片,比行業(yè)價格便宜85%。
“市場就是要充分競爭,做得好才能活下來。”接受21CBR等媒體采訪時,火山引擎總裁譚待提到,新模型發(fā)布后,豆包的增速將更快。
裝上眼睛
這次發(fā)布會,字節(jié)一口氣更新了豆包多款產(chǎn)品,覆蓋通用模型及多個垂直領(lǐng)域模型,看得人眼花繚亂。
更值得拿出來說道一二的,是首次亮相的新成員,視覺理解模型。
據(jù)譚待介紹,該模型不僅能精準識別視覺內(nèi)容,還具備理解和推理能力,可根據(jù)圖像信息進行復雜的邏輯計算,完成分析圖表、處理代碼、解答學科問題等任務(wù)。
其還擁有視覺描述和創(chuàng)作能力。
一句話總結(jié),“豆包”睜眼看物理世界了。
人所接收的信息里,超八成來自視覺。對大模型來說,只有做好視覺理解,才有能力處理好真實世界的信息。
譚待現(xiàn)場展示了多個案例。
譚待
給一張動物影子的照片,視覺理解模型能識別出這是一只貓;給一張橋的圖,模型能看出是港珠澳大橋;能理解圖片里的數(shù)學和物理題目,給出答案和思路。
此前,該模型已接入豆包App和PC端產(chǎn)品。譚待透露,過去兩個月,字節(jié)邀請了數(shù)百家企業(yè),測試豆包視覺理解模型。
其可應(yīng)用的場景很多。
比如,教育場景里,豆包可以讓拍照搜題更智能,批改孩子的數(shù)學作業(yè),優(yōu)化作文表述,減輕家長輔導作業(yè)的負擔。
快速擴列
從2024年5月豆包誕生,到12月的Force大會,7個月時間,字節(jié)大模型產(chǎn)品整裝列隊,組成“全家桶”。
除了新發(fā)布的視覺理解模型,重要的產(chǎn)品更新還包括:
豆包通用模型pro全面對齊GPT-4o,使用價格僅為后者的1/8;
音樂模型從生成60秒的簡單結(jié)構(gòu),升級到生成3分鐘的完整作品;
文生圖模型2.1版本,首次實現(xiàn)精準生成漢字和一句話P圖的產(chǎn)品化能力,該模型已接入即夢AI和豆包App。

譚待的演講末尾,還以“One more thing”做了一個特別預告,發(fā)布一個1分鐘的教育應(yīng)用場景視頻。
2025年春季,將推出具備長視頻生成能力的視頻生成模型1.5版,豆包端到端實時語音模型也將很快上線。
由此,多角色演繹、方言轉(zhuǎn)換等新能力,即將解鎖。
這一輪大模型競速,起步較晚的字節(jié),為何著急趕路?
“我們每一個模型的推出,都不算市面上最早的,但口碑和增長都不錯。”
譚待提到,聊天是大模型一個基礎(chǔ)功能,在此之上,必須加上深度推理、圖像視覺理解等各種各樣的功能,才能處理復雜任務(wù)。
目前,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入多家手機、PC等智能終端,覆蓋約3億臺終端設(shè)備。

來自智能終端的豆包大模型調(diào)用量,半年時間內(nèi)增長100倍。
與企業(yè)生產(chǎn)力相關(guān)的場景方面,字節(jié)也披露了一系列數(shù)字。
最近3個月,豆包大模型在信息處理場景的調(diào)用量增長了39倍,客服與銷售場景增長16倍,硬件終端場景增長13倍。
實用至上
“百模大戰(zhàn)”,從算力打到應(yīng)用。但在譚待眼里,談競爭,為時過早。
“我現(xiàn)在不太關(guān)心競爭。市場處于非常早期的階段,可能剛開發(fā)出來千分之一。”
他表示,局部競爭肯定有,但不重要,更關(guān)鍵的,是看用戶哪些需求沒有被滿足,產(chǎn)品和解決方案能否做得好、成本低。
讓大模型更好用、迅速落地,才是字節(jié)眼前的要緊事。如譚待所說,現(xiàn)階段,他不關(guān)注大模型能帶動多少云的收入,看的是有多少客戶用了豆包大模型、用得有多深。

圖蟲
按譚待總結(jié),大模型競技場,后來者字節(jié)的市場份額,領(lǐng)先同行,其信心來自三點:
一是市場足夠大;二是字節(jié)有規(guī)模優(yōu)勢,把手機、汽車、金融等外部客戶,以及抖音、頭條上的內(nèi)部客戶,統(tǒng)一起來建設(shè),都跑在火山引擎上;三是目標明確,要在新的技術(shù)變革里做到第一。
在他看來,大模型的特別之處在于,以前的技術(shù)在To C端和To B端,都是割裂的,大模型能化二為一,底層都用的一套技術(shù)。

由此,To B的商業(yè)模式,會發(fā)生很大的變化。





京公網(wǎng)安備 11011402013531號