
尋找下一個(gè)Transformer
作者/ 記者 孫永會(huì)
編輯/ 郝俊慧 孫妍
走進(jìn)上海西岸藝術(shù)中心,巨幅電子屏上跳動(dòng)著“模塑全球 無限可能”的標(biāo)語,2月21日至23日舉辦的2025全球開發(fā)者先鋒大會(huì)(以下簡稱GDC)的現(xiàn)場,匯聚無數(shù)開發(fā)者。
DeepSeek效應(yīng)下,開源AI市場正在形成一股洪流,開源亦成為GDC的焦點(diǎn)。工業(yè)和信息化部副部長熊繼軍在開幕式上指出,“要完善開源‘生態(tài)圈’,構(gòu)建先進(jìn)的開源服務(wù)體系”。上海市副市長陳杰強(qiáng)調(diào),進(jìn)一步完善開源開放生態(tài)系統(tǒng),夯實(shí)“語料開放+模型開源”服務(wù)體系,不斷壯大開源社區(qū)力量,推動(dòng)基礎(chǔ)模型、算法和數(shù)據(jù)資源的共享與開放。
智能硬件領(lǐng)域有哪些新成就?大模型開源后,相對閉源有哪些優(yōu)勢?記者在《開源共生:多模態(tài)大模型生態(tài)發(fā)展論壇》找尋問題的解決思路。
論壇當(dāng)日,鴻合科技、惟一智能、弋途科技、全志科技、魚亮科技、玩瞳科技、易思態(tài)科技等多家智能硬件企業(yè)與MiniMax(稀宇科技)共同成立“MiniMax智能硬件產(chǎn)業(yè)創(chuàng)新聯(lián)盟”。
程序員和藝術(shù)家“雙向奔赴”
22日,剛剛參加完論壇的Jason Lee在社交平臺(tái)發(fā)布了一則動(dòng)態(tài):“開源與閉源,不是零和游戲,而是互惠共生,共同構(gòu)成一個(gè)‘雙螺旋動(dòng)力環(huán)’,加速推動(dòng)技術(shù)普惠的進(jìn)程。”
Jason Lee是一名AI創(chuàng)作藝術(shù)家,近年來一直致力于電影級AI短片制作,代表作《滅絕》《鴉人國度》《黃金國度》,曾入選 Curious Refuge“The best AI Artists”等AIGC影視榜單,他坦言,AI是一劑催化劑,讓計(jì)算機(jī)專業(yè)畢業(yè)的自己有了“創(chuàng)意平權(quán)”的機(jī)會(huì)。
開源正讓越來越多的人成為開發(fā)者,隨著程序員和藝術(shù)家在AI的賦能下雙向奔赴,科學(xué)和藝術(shù)之間的“墻”正在被打破。
去年開始,MiniMax開發(fā)者社區(qū)負(fù)責(zé)人蔡佳人便發(fā)現(xiàn),很多垂類開發(fā)者,比如教育、醫(yī)療、金融、廣告營銷等領(lǐng)域的從業(yè)人員,已經(jīng)在用AI視頻大模型做AI廣告視頻生成,還有一些法律界人士,開始利用AI做法律相關(guān)的咨詢,AI正給傳統(tǒng)行業(yè)注入更多的生機(jī)和活力。

高性能大模型開源成風(fēng)
曾幾何時(shí),開源還是閉源,在全球范圍內(nèi)仍是一個(gè)備受爭議的話題,但時(shí)至今日,答案似乎正在揭曉,尤其對國產(chǎn)大模型而言,“開源”蔚然成風(fēng)。
本屆GDC上,多家參會(huì)企業(yè)紛紛亮出自家最新的開源模型:商湯科技發(fā)布LazyLLM開源框架等產(chǎn)品;MiniMax帶來今年1月發(fā)布并開源的新一代MiniMax-01系列模型,它是全球首個(gè)大規(guī)模應(yīng)用線性注意力機(jī)制、突破傳統(tǒng)Transformer架構(gòu)的商用級別模型;階躍星辰亦在會(huì)前發(fā)布全球參數(shù)量最大的開源視頻生成大模型Step-video-T2V……
“DeepSeek讓大家看到開源社區(qū)的勝利。把了不起的模型開源后,更多人得到機(jī)會(huì),可以在這個(gè)模型上做更多了不起的事情。”香港科技大學(xué)校董會(huì)主席、美國國家工程院外籍院士沈向洋于2月22日的大會(huì)主題演講中如是強(qiáng)調(diào)。

“底層模型一次重大迭代對產(chǎn)品帶來的優(yōu)化效果,遠(yuǎn)超在工程實(shí)現(xiàn)層面對產(chǎn)品‘雕花’。”MiniMax副總裁劉華表示,經(jīng)過兩年的發(fā)展,以Transformer架構(gòu)為代表的稠密模型已經(jīng)被放棄(因?yàn)槿蝿?wù)長度和算力消耗呈平方關(guān)系,任務(wù)越長,算力需求越高),MoE成為大家共同的選擇,而在未來兩到三年里,類似GPT3.5到GPT4這樣的技術(shù)突破再發(fā)生兩次是高度可預(yù)期的,因此MiniMax對所有技術(shù)創(chuàng)新全面開源,“我們希望有更多的開發(fā)者一起探索非Transformer的底層架構(gòu),只有非Transformer的底層架構(gòu)得到大家共識(shí),被更多人應(yīng)用,將來大模型才能處理越來越多更復(fù)雜的任務(wù)。”

不過,與會(huì)嘉賓也強(qiáng)調(diào),開源和閉源并不是二選一的排他性選擇,商業(yè)模式并不對立。
“閉源模型是一個(gè)產(chǎn)品,開源模型是一個(gè)工具。”HuggingFace中國區(qū)總經(jīng)理王鐵震表示,開源模型允許用戶不斷迭代和優(yōu)化,通過后訓(xùn)練和模型蒸餾等方式,使其更加適應(yīng)特定領(lǐng)域和需求,但作為一種工具,開源大模型的使用和維護(hù)需要一定的技術(shù)能力,而閉源模型則作為一種產(chǎn)品,更易于使用,只需調(diào)用API即可。
高擬人化智能硬件年內(nèi)出現(xiàn)
“我的發(fā)言稿就在眼鏡里,翻頁通過手上的戒指完成,所以沒紙質(zhì)稿子,很輕松。”近日,杭州靈伴科技有限公司負(fù)責(zé)人祝銘明帶火了AR眼鏡——Rokid Glasses。在GDC現(xiàn)場,AI耳機(jī)、AI拍攝眼鏡、智能無弦吉他,以及和Rokid Glasses有相同功能的AR眼鏡等智能終端同樣引人注目。
豐富的開發(fā)者生態(tài)讓AI加速融入普通人的生活,C端市場可能迎來爆發(fā)前夜。
“它由原先的被動(dòng)感知和被動(dòng)執(zhí)行,變成自主智能、自主思考,能想你所想,做你所做,在提前預(yù)知你預(yù)判的情況下,做對你有利的事情。”上海交通大學(xué)教授、曙光學(xué)者王琳定義了智能硬件。
魚亮科技CEO廖奎華表示,自家產(chǎn)品融合了自研端側(cè)的感知算法以及MiniMax的在線多模態(tài)大模型的核心能力,打造了多模態(tài)的智能硬件語音交互應(yīng)用平臺(tái),在AI眼鏡、新一代智能玩具以及各類硬件智能終端中已經(jīng)有所應(yīng)用。
不過,當(dāng)前來看,智能硬件依然面臨挑戰(zhàn),比如智能耳機(jī)要解決長上下文利用與響應(yīng)速度的問題,而AI眼鏡需要克服復(fù)雜聲學(xué)環(huán)境的干擾。
但與會(huì)者基本形成的共識(shí)是,智能硬件能否普及取決于多模態(tài)大模型的能力。
樂觀預(yù)期是,一年之內(nèi),多模態(tài)大模型的能力可以提升至當(dāng)前的語言大模型水準(zhǔn),低成本的使用門檻和完全可接受的成本,可以讓普通人也能順利實(shí)用,從而實(shí)現(xiàn)多模態(tài)大規(guī)模使用。
“我覺得真正高擬人化的智能硬件,在一年以后完全有機(jī)會(huì)實(shí)現(xiàn)。”魚亮科技CEO廖奎華認(rèn)為,五年以后,端云混合架構(gòu)的AI智能將會(huì)到來,一些超高擬人化的AI功能可以實(shí)現(xiàn)本地化部署,與一些高算力需求大模型的云端部署相融合,從而推動(dòng)AI進(jìn)入家庭和更多場景中。





京公網(wǎng)安備 11011402013531號