
(圖片躍問視頻demo)
生成式 AI 領域的技術競賽不斷加劇,已進入到“白熱化”階段。
今年以來,OpenAI接連發布Sora、GPT-4o、o1系列等多款模型,引發關注。此外,Runway 發布全新圖像模型 framer、Midjourney 準備發布 V7 版本、Claude 3.5 模型升級,而英偉達公布全新AI音頻模型Fugatto。
回到國內,字節跳動、百度、騰訊等大廠接連公布大模型技術和產品進展,開始用大模型實現“賣云”的增值。
國內大模型創業公司也在加速狂奔。
鈦媒體App獲悉,11月27日,專注于通用人工智能大模型(AGI)研發的公司“階躍星辰”(StepFun),日前已悄然開啟視頻生成模型 Step-Video 內測,用戶可通過“躍問”官網的“躍問視頻”產品進行點擊申請,且第二版視頻生成模型已經在研發中。

公開資料顯示,這家行事低調的大模型獨角獸,在8個月內接連發布了至少6款基座模型,且近期多款模型因為強悍的技術實力在國際上大放異彩。
短短一周內,階躍星辰多模態理解大模型Step-1V、萬億參數語言大模型Step-2分別躋身全球權威大模型評測基準榜單LMSYS大模型競技場 Chatbot Arena和LiveBench前列,皆位列中國大模型第一。
其中,Step-1V在LMSYS Chatbot Arena上,總分跟 Gemini-1.5-Flash-8B-Exp-0827 持平;Step-2在LiveBench榜單上的成績逼近 OpenAI 的 o1-mini-2024-09-12,超越 gpt-4o-2024-08-06 等國際主流模型,也是唯一進入榜單前十名的中國語言大模型。

(圖片來自 LiveBench 官網,截至今年11月19日數據)
“狂飆”600余天,階躍星辰建立全面模型矩陣
11月30日,OpenAI將迎來AI聊天機器人ChatGPT發布兩周年之日。
回顧過去兩年,ChatGPT引爆了全球新一輪 AI 大模型“造模”熱潮。《全球數字經濟白皮書(2024年)》報告顯示,目前,全球AI大模型數量已達1328個,其中美國占比最多達44%,中國占36%,這兩個國家已經牢牢占據大模型領域的第一梯隊。
全球AI大模型市場的競爭格局日益激烈。
在這一輪生成式AI熱潮中,國內最先起跑的是創業公司。成立于2023年4月的階躍星辰,在600多天的時間里,已形成行業領先的綜合技術實力。

包括近期低調內測的Step-Video在內,階躍星辰已經推出了Step系列通用大模型矩陣,涵蓋從千億到萬億參數、從理解到生成、從語言到多模態的全方位能力:
Step-1千億參數語言大模型:兩個月一次性訓練成功,已完成充分打磨,在邏輯推理、中文知識、英文知識、數學、代碼方面的性能全面超越 GPT-3.5。 Step-1V多模態大模型:性能比肩 GPT-4V,可以精準描述和理解圖像中的文字、數據、圖表等信息,并根據圖像信息實現內容創作、邏輯推理、數據分析等多項任務。 Step-2 萬億參數語言大模型:采用MoE架構,聚焦深度智能的探索,這是國內首個由創業公司發布的萬億參數語言大模型。Step-2 在語言生成上對細節有極強的控制力,模型能夠更好地理解和遵循人類指令。 Step-1.5V多模態大模型:在Step-1V的基礎上進行了迭代,具備更強大的多模態理解能力,實現了從圖像理解到視頻理解的跨越升級。 Step-1X圖像生成大模型:具有強大語義理解與圖像創意實現能力,可用于各種圖像創作和設計任務。 Step-Video視頻生成大模型:支持文生視頻,可生成 1080P 長達 10s 的高清視頻,在語義理解、指令遵循、運動、中國風美學生成上效果突出。目前模型已經接入“躍問視頻”并開始內測。

從上述兩個demo片段中,我們可以看到,無論是語義理解能力,細節運動符合物理規律,還是清晰度,階躍星辰的Step-Video視頻生成模型均達到業界先進水平。
事實上,在大模型“六小虎”中,階躍星辰以多模態模型技術實力強勁著稱。根據階躍星辰創始人、CEO姜大昕的規劃,階躍星辰實現AGI的技術路線是:“單模態 — 多模態 — 多模理解和生成的統一 — 世界模型 — AGI”。
他曾多次強調,只有解決了多模態理解生成一體化,才能徹底建立一個世界模型,再往后才能跟具身智能結合,最終實現AGI,以此提升社會、經濟產業的能力與價值。
2028年超4萬億規模,大模型加速技術落地
據研究機構IDC最新數據顯示,預計到2028年,全球 AI 產業支出將達到6320億美元(約合人民幣4.58萬億元),幾乎是當前的兩倍,5年間復合年增長率 (CAGR) 達29%。
其中,生成式AI成為最大的增長引擎,到2028年該領域投資支出高達2020億美元,占整個 AI 支出的32%,CAGR達59.2%。
不過,當前生成式AI產業仍處于非常早期的階段。
中國工程院院士、北京大學博雅講席教授、鵬城實驗室主任高文認為,如果以“人”來相比,AGI現在可能還是剛剛會走路的幼兒狀態。但從使用角度看,AI已經能解決生產、社會、服務的問題,可以先用起來,沒有必要等到十全十美再去用,要把它逐步的開發、完善、迭代。
越來越多的開發者和企業開始基于階躍星辰的大模型矩陣打造AI應用。階躍星辰開放平臺逐漸形成了一個大模型“生態伙伴圈”。金融財經、內容創作、消費娛樂等領域的頭部機構紛紛跟階躍星辰達成技術合作。其中,財聯社跟階躍星辰共同打造了國內首個千億參數多模態金融大模型“財躍F1金融大模型”。
開發者則通過階躍星辰的 Step 系列大模型嘗試新的產品形態。獨立開發者趙純想將包括網紅AI應用“胃之書”在內的三款產品都接入了階躍星辰 Step 系列大模型,原因是胃之書早期對國內所有大模型做了產品 AB test 測試,他發現使用階躍星辰的模型,用戶付費率最高;AI 心理療愈應用“林間聊愈室”則是基于階躍星辰多模態大模型的圖片理解能力,上線了呼聲已久的 AI 識圖功能,用戶可以跟小動物分享自己的生活場景、狀態等,林間聊愈室CEO李神龍表示,接入新功能之后,比較明顯的是付費率確實上漲了。
下一步,我們相信,階躍星辰這類堅持AGI底層技術探索,加速模型應用落地的公司,將成為AGI時代的關鍵“推手”,同時也是AGI產業的技術領先者。
智能階躍,十倍每一個人的可能。
(本文首發于鈦媒體App,作者|林志佳,編輯|胡潤峰)





京公網安備 11011402013531號