
圖片企業(yè)官方
12月19日訊(記者 朱俊熹)字節(jié)跳動再卷AI模型價格。在12月18日舉辦的火山引擎Force大會上,字節(jié)跳動正式發(fā)布豆包視覺理解模型,輸入價格為0.003元/千tokens。繼通用大模型后,多模態(tài)模型也由以分計價邁入以厘計價的階段。
據(jù)字節(jié)旗下云服務(wù)平臺火山引擎介紹,豆包視覺理解模型的定價比行業(yè)價格低85%,相當(dāng)于一元錢就可以處理284張720P的圖片。與國內(nèi)外其他具備多模態(tài)能力的大模型相比,OpenAI GPT-4o的輸入價格為0.0175元/千tokens,Anthropic的Claude 3.5 Sonnet定價為0.021元/千tokens,阿里Qwen-Vl-Max為0.02元/千tokens。
今年5月,字節(jié)跳動在正式對外發(fā)布豆包大模型時,就曾因定價比同行低99.3%而掀起波瀾。阿里云、百度、騰訊等頭部廠商很快緊隨其后,紛紛宣布跟進(jìn)降價,燃起了國內(nèi)大模型價格戰(zhàn)。在低價的驅(qū)動下,大模型的應(yīng)用也開始加速。火山引擎數(shù)據(jù)顯示,截至目前,豆包通用模型的日均tokens使用量已超過4萬億,較首次發(fā)布時增長了33倍。
火山引擎總裁譚待在接受媒體群訪時提到,隨著模型成本大幅降低、效果得到提升,近半年來市場上對于模型使用的反饋才多了起來,開始更關(guān)心模型調(diào)用量、token數(shù)。他在演講時表示,“我們希望用一個合理的、可持續(xù)的,關(guān)鍵是一步到位的價格,讓企業(yè)和開發(fā)者可以放心大膽地去使用,去做多模態(tài)。”
新推出的豆包視覺理解模型能夠精準(zhǔn)識別視覺內(nèi)容,同時具備理解和推理、視覺描述等能力。在現(xiàn)場示例中,該模型可以識別動物的影子輪廓、雜志內(nèi)頁的星云、體檢報告的某項具體指標(biāo)。其應(yīng)用場景可能包括教育方面的判卷指導(dǎo)、作文批改,或旅游、電商營銷等領(lǐng)域。
譚待稱,字節(jié)跳動在類o1的推理模型領(lǐng)域同樣有所布局。在解答數(shù)學(xué)、物理、代碼問題上,豆包視覺理解模型已具備此類能力的雛形。完整版推理模型會在進(jìn)一步完善后推出,“不會太久”。
除字節(jié)外,國內(nèi)也有大模型公司在視覺方向取得新進(jìn)展。12月16日,獨(dú)角獸月之暗面發(fā)布視覺思考模型k1,主推既能通過視覺精準(zhǔn)識別,又能分布推理思考,在數(shù)學(xué)、物理、化學(xué)等評測中表現(xiàn)領(lǐng)先。上周,私募巨頭幻方量化旗下的AI公司DeepSeek開源全新視覺模型VL2。該公司稱,視覺是人類獲取外界信息的主要來源,在大模型方面的進(jìn)展卻遠(yuǎn)遠(yuǎn)落后于語言模型,提升模型視覺能力的意義更在于全方位提升其感知和認(rèn)知能力。
在此次火山引擎活動中,字節(jié)跳動還發(fā)布了豆包3D生成模型,多款產(chǎn)品迎來更新。其中,豆包通用模型pro已全面對齊GPT-4o,使用價格為后者的1/8。音樂模型的支持時長從60秒升級至3分鐘,文生圖模型2.1版本能夠?qū)崿F(xiàn)精準(zhǔn)生成漢字、一句話P圖等產(chǎn)品化能力。字節(jié)預(yù)計,明年春季將推出具備更長視頻生成能力的豆包視頻生成模1.5版,并很快上線端到端實時語音模型。
談及對大模型未來落地場景的判斷時,譚待稱AI對話是一個通用的場景,但大模型在生產(chǎn)力、商業(yè)化場景中的增速并不慢。以近3個月為例,豆包大模型在信息處理場景的調(diào)用量增長了39倍,客服與銷售場景增長16倍。“聊天功能是一個很基礎(chǔ)的功能,得加上深度推理、視覺理解等功能才能處理更復(fù)雜的任務(wù)。而這才是模型之后發(fā)展空間越來越大的前提,視覺對大模型的調(diào)用量和場景會帶來很大的幫助。”譚待表示。
在譚待看來,市場仍處于早期,比起競爭會更關(guān)注用戶對復(fù)雜語言場景、視覺等方面的需求。與互聯(lián)網(wǎng)時代C端先于B端崛起不同,大模型的這兩個方面并不是割裂的,其背后都基于同樣的模型能力。因此,字節(jié)對大模型的判斷是To B和To C齊頭并進(jìn)。
對火山引擎這一對外開放字節(jié)技術(shù)工具的云廠商而言,AI成為了新的增長機(jī)會。譚待表示,拉升火山引擎市場份額的關(guān)鍵在于兩點(diǎn)。一是規(guī)模優(yōu)勢,做到規(guī)模大、彈性高、成本便宜,企業(yè)會自然而然地遷移過來或作出選擇。而火山引擎的優(yōu)勢是從初期起,就將字節(jié)旗下抖音、今日頭條的內(nèi)部規(guī)模與外部規(guī)模統(tǒng)一起來建設(shè)。其次,要把握住AI大模型這一技術(shù)變革,通過豆包獲得更多關(guān)注和新的合作機(jī)會。
譚待并未透露云收入受大模型帶動的具體數(shù)據(jù),僅對使用大模型的客戶數(shù)量、使用程度給予了肯定的評價。“從云原生到AI云原生,火山希望做成這塊的領(lǐng)軍企業(yè)。”他表示。





京公網(wǎng)安備 11011402013531號