
昆侖萬維并不是一家容易讀懂的公司。成立17年,上市整10年,從瀏覽器、社交、搜索、游戲,到近兩年涉足AI音樂、AI短劇等,它從未遠離過大廠云集的風口。
但能在巨頭臥榻之側長久生存,昆侖萬維總結出了一套獨特而實用的“中廠”生存哲學:找準細分市場,不進紅海;做好付費賽道,堅持盈利。
更多時候,昆侖萬維貼緊大廠的節奏,又將觸角伸向其射程外的市場。2023年,乘著AI的東風,昆侖萬維股價在幾個月時間里飆升了5倍。其實,昆侖萬維的生意早已遍布五大洲70多個國家。
“寧為雞口,不為牛后。”已加入昆侖萬維17年的董事長兼CEO方漢言簡意賅地對《財經天下》說。他總結,中廠要懂得從終局思考,在當下的大模型軍備競賽中,中廠更需要在自己熟悉的賽道中做到“SOTA”(State-of-the-Art,當前最佳技術或最前沿水平)。
去年4月,昆侖萬維發布了第一代音樂生成模型Mureka V1(SkyMusic)。經過一年的改進調試,3月26日,昆侖萬維上線了最新版音樂大模型Mureka O1與基座模型Mureka V6。“我們最后用了O1的名字,因為它是真正全面超過Suno的音樂生成模型。”方漢說。
除了新上線的音樂模型,方漢也與《財經天下》分享了他對當下火爆的AI Agent賽道的理解:“一流的企業做協議,二流的企業做產品,三流的企業做市場。現在大家不會再讓一個公司去壟斷所有,這里面(屬于中廠和創業公司的)機會跟空間就非常多。”

▲昆侖萬維董事長兼CEO方漢。圖源/受訪者
01、追逐SOTA紅利,節省營銷
昆侖萬維之所以選擇在音樂模型上“單點突破”,有內外因的考慮。“(音樂大模型)是一個比較窄的賽道,不像文本大模型那么熱。算力成本低也是一個重要因素。”方漢說。
而在必要的訓練數據上,昆侖萬維也有不為人知的積累。2017年,K歌軟件在國內蔚然成風,昆侖萬維創始人周亞輝如法炮制,在海外孵化了音樂平臺StarMaker。
他曾直言:最好的商業就是不競爭之地。彼時,昆侖萬維便繞開了國內市場,將StarMaker的重心錨定在了中東、非洲、東南亞等地。
同時,為了解決大量歌曲缺少人聲伴奏版本的問題,昆侖萬維專門組建了AI作曲實驗室StarX MusicX Lab,研發將近三年,將AI人聲消除技術做到了世界頭部水準。
這不僅為StarMaker帶來了用戶,也打下了日后研發音樂大模型的技術基礎。“人類到現在為止,總共只生產了4000萬首音樂。在這個過程中,我們對大量音樂進行了處理,也收集了全球各地的公開版權音樂。”
2022年底,StarMaker累計注冊用戶達3.1億。“如果說誰家手上的全量音樂數據是最多的?我們可以說跟騰訊、字節一樣,都是頭部梯隊。”方漢說。
2021年開始,昆侖萬維便已立項了音樂生成模型。早期模型多采用符號生成技術,2024年4月,昆侖萬維發布了第一代采用擴散生成技術的音樂模型Mureka V1(SkyMusic),獲得了外界的不少好評。
對于新版Mureka O1,方漢給團隊的定位非常明確:要從產品角度、技術角度全面超越Suno,在該賽道上做到SOTA。

為何要執著追求SOTA?源于方漢對昆侖萬維“中廠”的定位。“有了SOTA,你可以不用做任何營銷,產品紅利會迅速地爆。”
他以DeepSeek-R1為例,憑借“推理大模型”的細分賽道SOTA,迅速搶占了中國文本大模型客戶端第一的位置。在國外拉到了好多客戶,也幾乎沒有花過PR費用。“我們很清楚,這一波大模型你沒有SOTA,就拿不到技術跟產品紅利。”
而在音樂大模型的評測中,Mureka O1在人聲、BGM(背景音樂)、混音等方面已經領先Suno V4。同時,在海量曲庫下,Mureka O1可支持10種語言,幾乎覆蓋了世界上90%的人群。

▲Mureka O1的多語言選擇。來源/官網
Mureka O1在技術層是如何做到SOTA的?方漢表示:Mureka O1的最大突破便是首次將“思維鏈(Chain of Thought,簡稱‘CoT’)”技術引入到了音樂模型中。這也是方漢在研讀了DeepSeek-R1的技術報告后,得到的啟發。
CoT顧名思義,是在推理過程中加入了思考與自我批判。而市場的上一代音樂模型多基于Diffusion in Transformer(擴散模型與Transformer架構相結合的技術),比較隨機、無目的。
方漢形容,這會讓生成音樂的過程像“一錘子買賣”,一口氣來十幾首曲子,交給用戶人工調整。
在CoT支持下,Mureka O1會更有目的,能在生成之前預測整個音樂結構,通過O1自有的評分模型,挑出最好的結果交給用戶,從而讓生成質量、歌詞旋律契合度、發音唱對率、藝術表現力大幅提高。
“預測的過程,就是MusicoT框架的核心。”方漢說。而評分模型則是基于StarMaker的用戶積累,對Mureka V1生成結果的打分形成。
“這個數據只有在線上大量地跑,跑幾千萬首歌才能跑出來。我們再把這幾千萬的數據篩選、清洗、人工標注,最后得到真正用來訓練的數據量其實不大——但那是最核心的數據。”
02、AI音樂要向誰收錢?
除了技術作為底座,Mureka O1也添加了多項功能創新。
此前在StarMaker上,昆侖萬維觀察到K歌產品里最受歡迎的歌手,往往是其音色與某一歌星相近的。因此在Mureka O1里,模型也為用戶提供了“音色克隆”功能。
Mureka O1還新開放了“微調API”。例如冬不拉這種小眾樂器很少出現在生成器選項中,但在Mureka O1上,用戶可以通過上傳大量由冬不拉演奏的音樂來微調模型,Mureka O1就能據此來生成高質量的冬不拉音樂。
那么,Mureka O1音樂大模型的用戶群體是誰,商業模式又如何?方漢表示,最龐大的用戶基礎是C端愛好者。過去,生產一首專業音樂的成本要在10萬元左右,AI音樂的介入將直接為他們降低創作門檻。
而在付費端,昆侖萬維主要瞄準的是影視、游戲、音頻等領域的從業者,付費用戶可獲得更高速度、優先的AI生成機會。
這有些不同于Suno的“走量模式”——目前Suno的免費會員每天最多生成10首歌曲;愿意支付每月8美元、24美元的付費會員,每月分別可生成500首和2000首歌曲。
而昆侖萬維除了會員付費,更傾向于為B端客戶提供專業功能,通過SaaS或PasS服務收費。2024年,昆侖萬維的音樂大模型得到了如中國聯通、中國移動,以及一些造車企業的大客戶,和海外小B客戶的合作。
方漢坦言,在國內靠用戶訂閱付費的商業模式還很難成立,堅持服務于有付費習慣的B端和C端用戶,也是昆侖萬維堅持出海的原因之一。“作為一個中廠,不賺錢就活不下去,這是很實際的問題。”

從商業模式上,昆侖萬維認為Mureka O1更適合“平替”的是數字音樂工作站(Digital Music Workstation)。
這個市場原來更多服務于專業人士,“大概一年40億美元規模,已經比較成熟了。而我們就好比為他們提供了一個平民化工具,類似給視頻平臺提供了‘剪映’。”
未來音樂大模型的發展方向會是怎樣?中廠又該如何選擇賽道?“這就要對終局反復思考”,方漢說。
“AGI是夢想,但AIGC更容易賺錢,AIGC皇冠上的明珠一定是視頻生成。”而在視頻生成中,還需要音樂、音效、音頻來配合。
在整個視頻生成生態中,昆侖萬維又要如何卡位?“我們有音樂數據,先卡音樂的位置。有短劇方面的經驗和渠道,再去卡短劇這個位置,不斷地縮小我們的卡位。”
2月18日,昆侖萬維在Hugging Face上開源發布了視頻生成模型SkyReels-V1,兩個星期左右,下載量超過了10萬。
作為中國首個面向AI短劇創作的視頻生成模型,SkyReels-V1不僅支持文生視頻(T2V)、還能支持圖生視頻(I2V),是開源視頻生成模型中參數最大的支持圖生視頻的模型,在同等分辨率下各項指標同樣實現了開源SOTA。

方漢表示,SkyReels-V1定位是在短劇場景,而非一般視頻生成。“更準確地說,這是一個表演大模型,專門為使用者和觀眾生產最高質量的短劇以及影視劇。”
03、中廠的卡位之路
在方漢的判斷中,音樂和短劇市場的上限還極大。
例如,視頻生成后,沒有音樂,用各種各樣的AI工具去匹配,讓人去卡時間軸,還要卡得很準,是很困難的。而借助于音樂大模型,可以一攬子將視頻、配音、配樂全部生成,“保證你的點是準的,這對于影視制作是非常強的協同”。
雖然與渠道之間的商業生態,仍會存在漫長的磨合過程,但對于廣大MCN,尤其是短視頻作者來說,AI音樂會讓素人創作型歌手更容易冒出來,是確鑿無疑的。
對于很多音樂創作者認為“AI音樂沒有靈魂”的疑問,方漢認為,偏見需要時間去消除。“國內已經有頂尖創作者,比如郭帆導演與我們聯系。2024年的春晚,也已經出現了AIGC的內容。比如任素汐跳舞的背景就是由AI生成的。”
作為“中廠”要如何處理與巨頭的競爭關系,昆侖萬維已習慣淡然處之。
“在AIGC上,中廠還是大有可為的。大廠本質上是to C基因,就像字節做剪映一樣,它終歸是為自己的平臺去服務。對于其他客戶的需求,響應得不會有那么多。”而昆侖萬維正因為是“小廠”,從而更加開放,“什么樣的視頻生成模型我們都會去適配。”
特別是在DeepSeek引發了新一輪技術創新之后,AIGC技術將更多落實到產品上,也讓中小廠的機會更多閃現出來。
方漢分享了一個行業觀察:2023年創業的AI企業CEO幾乎全是算法工程師,2024年開始有一些CEO是產品出身。“2025年往后,我覺得會有更多產品出身的人會去做AI產品。”
他表示:互聯網行業人士常說,一流的企業做協議,二流的企業做產品,三流的企業做市場,在大模型領域也是如此。
例如,Anthropic做的MCP協議(模型上下文協議)在Agent領域應用非常廣。“基于MCP協議開發的Agent,我們看到的已經有上萬個了。”近日,OpenAI、谷歌、阿里也都紛紛仿效Anthropic,宣布擁抱MCP,上線了新的服務平臺。
“Agent最后會都捆在一個模型當中嗎?不可能,一定是所有的模型都適配。而從協議到生態,還有很長的路要走。”
方漢透露,有中國公司正在嘗試做Agent的工作流生態。接下來,Agent要適配所有模型,要用什么協議來適配?千奇百怪的長尾需求誰來響應?要用什么樣的工具去完成Agent Marketplace(用于展示和銷售各種AI Agents)?在上層如何去管理Agent Marketplace?“這就涉及很多路徑,有開源路徑,有閉源路徑。”
而AI生態的發展路徑勢必不會重復移動互聯網的老路。“像安卓或者iOS商店那樣,是所有人都不想看到的,因為大家在上面吃的苦頭已經夠多了。”
如何用更開放的生態來做Agent Marketplace,又要如何找用戶去收費?類似Manus這樣的Agent只是剛冒出來的事物,走到通用Agent市場將是漫長的過程。“大家不會再讓一個公司去壟斷所有,這里面的機會跟空間就非常多。”
作者 | 林小葵,編輯 | 李不清,圖片來源 | 視覺中國,本內容來自財經天下WEEKLY





京公網安備 11011402013531號