
要堅持的和將放棄的,都基于未來想成為的樣子做考量
文 | 施然
中國人工智能(AI)產業在過去10年歷經多個關鍵節點。2017年谷歌AlphaGo在中國戰勝圍棋世界冠軍柯潔,驗證了AI在這一度被認為人類智力巔峰的領域超過了人類的最高水平,從而開啟了AI產業的新一輪爆發式增長,AI算法快速在各個產業里落地并產生價值:從人臉識別、身份驗證,再到互聯網平臺的算法推薦,廣告精準投放等。多輪技術周期轉換中,出現了一大批前期被肯定、后期被驗證的公司。
商湯科技是其中一家。商湯成立于2014年,到今年已經是第10個年頭。從最早的人臉識別算法,到今天的大模型,商湯參與并見證了中國AI產業的發展、挑戰和調整。2021年12月,商湯在港交所上市,最新市值569億港元。今年以來,商湯市值上漲超過50%。
10年過去,商湯從一家快速增長的AI明星初創公司,變成一家成熟的商業化公司。經歷了中國AI科技投資的狂熱期到冷靜期,經歷了AI技術的兩次大變革,也經歷了國際形勢變化帶來的地緣政治影響。
今天,生成式AI的發展日新月異,世界距離通用人工智能的目標越來越近,商湯作為中國人工智能行業的代表,也快速調整戰略目標。和今天備受關注的創業新貴不同,在AI圈里摸爬滾打了十年的商湯更關注如何盈利,如何真正讓AI技術落地應用,如何成為一家有能力穿越周期的科技公司。
圖說:商湯科技上海總部大樓

摸爬滾打的十年

商湯最早是通過計算機視覺技術(CV)進入AI行業。商湯科技董事長兼CEO徐立回憶,當科研突破進入產業的時候,大家都在驗證一件事,就是AI技術精度究竟能不能過工業的紅線。彼時各家公司開發不同的AI模型在垂直行業中試水落地,大概經過兩到三年的驗證后,就像AlphaGo在圍棋中的驗證一樣,以人臉識別、圖像識別為核心的一批模型過了工業應用的紅線。
2017年前后,人臉識別技術開始陸續應用于不同垂直場景中,包括智慧城市、身份識別驗證等。接下來,行業思考的新問題是如何讓AI應用于更多場景和行業中。在當時更普遍的方式是造更多模型。
今天回頭來看,通過投入大量研發人員造更多領域模型的路徑已經基本被迭代,主流方式是造更通用的大模型,再在模型基礎上微調出專用模型。當時那個節點,很少有人去想更遠的未來,去探索未來的路徑,畢竟模型是否能通用尚需驗證。
商湯無疑是有遠見的,率先投入通用模型的研發和AI算力的發展。“如果你每個場景都用投入研究人員訓練不同模型,最后可能你要做成百上千個模型,完成一個復雜的任務,模型的生產降不下來。” 徐立發現,這階段AI模型的生產成本主要是人。事實上,當時的AI公司的研發成本幾乎就等價于研發人員薪酬。
伴隨商業化進程的深入,要做通用的、端到端的模型變成商湯思考的主要方向。2019年,商湯對外提出做通用視覺大模型;在自動駕駛領域,又率先提出了做端到端的大模型UniAD。
徐立發現,在走向通用的過程中,AI算力的重要性愈發上升。一個復雜的任務如果能分解為三個子問題,假設每個環節有10個參數,訓練3個專用模型來解決這些問題只需要30個參數,而如果要用一個通用端到端模型來解決,那就變成有1000個參數(10乘10乘10),相當于參數量增加了100倍,這意味著算力規模要呈幾何級數增加。
“如果你每個場景都用一個不同的模型去做,最后可能你要做1000個模型,這很難實現,人手都不夠,模型的價格也降不下來。”徐立發現,這一路徑顯然距離跨越“工業紅線”越來越遠。
所以,通用模型的打造成了2019年商湯的重中之重,商湯是國內最早一批投入通用大模型研發的廠商,這也成為其構建AI價值商業閉環的先發優勢,而這背后的大規模AI基礎設施建設投入也隨之提上日程。徐立原計劃用租賃算力完成通用模型研發,但當時市場上沒有成熟的大規模算力基礎設施,只能自己去建不說,此前甚至都沒有前人經驗完整搭建過一套大規模智算系統。商湯成了第一個吃螃蟹的人,投建了自己的算力大裝置,組建了大裝置團隊完成超大規模的算力訓推軟件平臺的搭建。取名算力大裝置,徐立是將其對于AI的作用類比于粒子對撞機之于高能物理學。如今商湯所持有的5.4萬塊GPU和超過20,000petaFLOPS算力,已經成為行業公認的稀缺資源。
而在2018年—2022這幾年間,資本對于AI的態度以及國際環境都發生了巨變。2018年到2021年是中國AI創業、融資爆發式增長的四年,以商湯為代表的AI創業公司們在那幾年快速獲得高額融資,走到上市節點。創投數據服務商IT桔子數據顯示,2018年,中國AI領域共融資2373億元,同比增長93%。2021年共融資3996億元,同比增長51%。
但市場熱度在2022年出現明顯下滑,這一年AI領域融資額降至1579億元,同比下滑64%,2023年繼續下滑至1101億元。
和融資熱度下滑同時出現的,還有外部水溫的變化。在此之前,AI領域的融資以美元投資機構為主,他們看重前沿技術,也愿意為初創公司早期的高額研發買單。但2021年,美國加大對中國科技公司的制裁力度,美元機構陸續退出。
商湯的融資上市過程可謂是一個縮影:商湯在2019年被美國列入實體清單,2021年上市期間又被美國列入涉軍企業清單(CMIC)。但仍頂著壓力于當年12月30日在港交所掛牌上市,獲得了穩定的融資渠道,提升了抗風險能力,這為商湯繼續發展通用智能和AI智算奠定了基礎。
和全球大部分AI公司一樣,商湯還處于虧損階段,但作為上市公司,商湯面臨商業化落地和保持技術領先的雙重考驗,想要扭虧,需要一邊擴大收入,一邊降低成本。
現在看來,商湯在AI基礎設施方面的投入和通用大模型的路線選擇,與OpenAI等國際巨頭十分吻合。要搞好算力基礎設施軟件能力,需要深入理解大模型。2023年4月,商湯在國內率先發布了“日日新SenseNova”大模型體系,發布時,徐立提到,通用模型的能力比單純的規模更重要,商湯在過去積累了不少客戶,解決了很多行業問題,因此積累了大量真實數據,能夠讓模型在通用的基礎上,在垂直領域更好用。在此后一年3個月的時間內,“日日新”迭代至5.5版本,交互效果和多項核心指標實現對標GPT-4o,也是國內對標GPT-4 Turbo領先的國產大模型之一。
商湯技術上的領先也迅速體現在商業上。今年8月商湯發布的半年財報顯示,2024年上半年,商湯收入17.4億元,同比增長21%;毛利7.7億元,同比增長18%。商湯財報中,收入來源按業務分為三大類,生成式AI、智能汽車和傳統AI,其中生成式AI占比60.4%,是目前商湯收入占比最高的業務。
新的機遇和挑戰

把原來傳統AI構建一個個場景模型的時代稱為AI1.0的話,徐立認為,生成式AI或者AI2.0時代除了模型的通用性之外,最大的特點是成本結構由“研發人員密集型”轉化為了“算力資源密集型”。OpenAI研發ChatGPT的時候研發人員只有87人。由一套算力基礎設施支持行業應用,實現服務邊際成本極低,是理想的模式。但實際上,目前算力資源成本巨大,以現有的應用規模來說,很難看到盈虧平衡。2024年9月,微軟與貝萊德攜手成立300億美金的AI基建基金。
商湯是上一輪AI產業爆發中,少數成功上市的AI公司。一些業內人士擔心,商湯在資金儲備方面不及互聯網大廠,可以大規模投入今天的生成式大模型;又不像初創公司那樣可以暫時不考慮商業回報,通過一級市場大規模融資來獲得技術投入資本。
徐立卻認為,過往十年的AI1.0時代客戶和應用,使得商湯更了解市場需要什么樣的AI產品和服務。其次,也因為長期專注于AI底層基礎設施與模型應用,商湯積累了可觀的算力規模和技術資源,以及高效運營這些資源的能力。“電力和通信流量都是基礎設施,一套基礎設施就能服務千行百業,但是早期的成本也都居高不下,隨著技術的迭代以及使用人數的擴大,邊際成本就忽略不計了”,現在AI基礎設施正處在這樣的重要轉折點。
他總結,商湯是最懂模型的算力服務商,最懂算力的模型服務商。
商湯也需要將傳統AI客戶轉化為生成式AI客戶,隨著客戶需求和技術迭代,讓生成式AI商業應用能夠快速進入市場。在具體應用行業上,商湯需要做到更聚焦。AI1.0時代的行業客戶,在通用人工智能來臨之際,已經快速將日日新大模型部署到各領域,一些垂直行業場景包括金融領域,如商湯金融的數據先兵產品聚焦數字化分析;在智能辦公領域,比如在Copilot助手(個人AI助手)商湯 “小浣熊”產品個人用戶和開發者達數十萬,亦服務于金山辦公等頭部應用。此外,在大模型擬人交互領域,商湯日日新大模型支持了新浪微博、閱文集團筑夢島、愛奇藝等互聯網應用,日均Tokens數達數百億,調用量在半年內增長近22倍。
商湯下一步的產品和業務目標是“用得上、用得好、用得起”。用得上是指能真正為用戶創造價值;用得好是要進入客戶的生產和流程中;用得起,則是需要大幅降低訓練、推理和部署成本。
為了實現這一目標,商湯決策層制定了“大裝置-大模型-應用”的三位一體核心戰略。大裝置是指模型的基礎設施服務,以算力服務為主。徐立提到,如果只有基礎設施,不懂大模型的話,就沒有競爭力。今天使用算力主要有兩類,一是訓練模型,二是使用模型。訓練模型時,需要優化算力使用效率;使用模型的時候,則需要節約算力成本。
“今天人工智能的商業模式不管是訓練模型,還是用模型對外服務,本質意義上都是在消耗資源,付的是資源的費用。所有的商業模式最后都和計算資源消耗畫了一個等號,就是通過‘三位一體’,把資源以最有效的方式利用起來。”徐立表示。
按照這樣的戰略布局,商湯認為,算力和模型的深度協同,能讓大模型迅速迭代,并降低推理成本,從而獲得更多用戶和調用量增長,實現收入提升。例如在推理場景中,商湯以創新的技術架構實現了相同算力及電力成本下的每秒請求數(QPS)提升4倍,并實現了推理服務彈性按需伸縮,優化了大規模AI推理的整體成本。
算力服務是不少科技巨頭也在重點布局的方向,徐立認為,一些科技巨頭的重心在于自己的生態,包括自研芯片和云平臺等。但當下AI領域要搶占先機,什么資源更快更好用就先用起來,不局限于一家的產品和平臺。徐立認為,商湯提供的基礎服務更貼近AI發展現狀。
穿越技術周期的兩條腿

今天,AI領域最大的挑戰就是商業模式不清晰。算力的投入,數據的投入和人才的投入都相對確定,甚至連AI可能帶來的風險和威脅都已經被多次討論。但AI究竟能怎么賺錢,最終的產品形態如何,目前還很難有定論。
商湯這樣的AI技術公司,能否成功穿越新一輪技術轉換周期,取決于兩點:其一,走得夠快;其二,走得夠遠。
徐立說,今天對于AI公司來說挑戰很大,因為“技術投入永遠要比商業化前置”。如果決定要做大模型,那就需要長期的資源投入,有新的方向出現都要跟進。但實際的回報可能要等很長的周期。
上市后的商湯有了更清晰的規劃——盈利。
徐立說,商湯目前有兩條腿,一條腿是傳統AI,技術成熟,不斷降低成本、拓展市場(包括海外市場),聚焦利潤貢獻;另一條腿新一代的AI大模型,目標是盈虧平衡,這條腿增長很快,且能看得到未來。前者保證商湯“走得夠快”,后者保證“走得夠遠”。
商湯在不斷探索不同的商業的模式,比如:賣一體機。一臺機器配一定數量的賬號,能夠實現本地化部署,即買即用,一方面能降低客戶應用AI的門檻,另一方面也能幫助客戶節約使用成本。這一模式相對軟件模式,毛利偏低,但商業化效率提升明顯。
在海外市場,商湯也未放棄軟件模式。事實上,目前全球范圍內,中國和美國是AI領域的兩大高地,中國的AI技術對很多海外國家來說,都是非常領先的。徐立說,海外客戶對于AI軟件的購買意愿很高,且回款周期短。目前商湯在傳統AI領域已經有非常成熟的產品和解決方案,只需要繼續拓展海外銷售渠道即可。
據了解,商湯目前海外市場的年營收增長率約40%,高于21%的整體增長率,海外市場占集團總收入比例提升至18.5%。目前,海外市場對于商湯來說是賺錢主力之一,且在海外能沿用軟件模式,毛利更高。海外市場營收和利潤的增長也能夠幫助商湯更好地投入到大模型業務中。
接下來,考驗AI公司的是如何實現大模型的商業化。據媒體報道,OpenAI GPT-4的一次訓練成本約6300萬美元,2022年的總訓練成本約5.4億美元。OpenAI稱2024年的運營成本將超過85億美元,預計虧損約50億元美元,預計2023年至2028年的總虧損(不包括股權補償)將達到440億美元。OpenAI還提到,模型訓練成本還將進一步增長,預計到2026年每年將達到95億美元。
可以預見的是,大模型依然會在通用的道路上前進,但很難在短時間內實現真正的通用。此外,隨著開源模型的能力越來越強,對于一些科技公司來說,再去“卷”參數、做預訓練價值不大。更實際的方式是,通過針對性訓練,去提升較小模型的專有能力,也相當于是“降本增效”,這可能是更符合當下市場環境的做法。
從訓練到推理,算力的資源屬性愈發顯現。商湯也在積極布局算力運營,希望在現有條件下將已投入打造的資源變現。現實情況是,目前市場上的算力資源分散且標準不統一,使用起來效率不高。而商湯可提供算力運營服務,將不同標準的卡連接起來,適配不同需求,滿足那些需要使用算力的客戶。
2024年10月18日,商湯科技十周年國際論壇上,徐立表示,當下正處于AGI(通用AI)的轉折點,大模型快速發展很大程度是因為基礎設施水平有顯著提高,讓通用AI模型成為可能。徐立還提到,早在2014年商湯成立之時,商湯創始人湯曉鷗就強調,要把技術帶到日常生活中,希望技術能夠融入生活的不同場景。這句話放到今天仍不過時。





京公網安備 11011402013531號