生成式AI迎來窗口期，階躍星辰加速沖刺

IP屬地中國·北京 編輯：江紫萱鈦媒體APP 時間：2024-11-27 20:00:53

（圖片躍問視頻demo）
生成式 AI 領域的技術競賽不斷加劇，已進入到“白熱化”階段。
今年以來，OpenAI接連發布Sora、GPT-4o、o1系列等多款模型，引發關注。此外，Runway 發布全新圖像模型 framer、Midjourney 準備發布 V7 版本、Claude 3.5 模型升級，而英偉達公布全新AI音頻模型Fugatto。
回到國內，字節跳動、百度、騰訊等大廠接連公布大模型技術和產品進展，開始用大模型實現“賣云”的增值。
國內大模型創業公司也在加速狂奔。
鈦媒體App獲悉，11月27日，專注于通用人工智能大模型（AGI）研發的公司“階躍星辰”（StepFun），日前已悄然開啟視頻生成模型 Step-Video 內測，用戶可通過“躍問”官網的“躍問視頻”產品進行點擊申請，且第二版視頻生成模型已經在研發中。
公開資料顯示，這家行事低調的大模型獨角獸，在8個月內接連發布了至少6款基座模型，且近期多款模型因為強悍的技術實力在國際上大放異彩。
短短一周內，階躍星辰多模態理解大模型Step-1V、萬億參數語言大模型Step-2分別躋身全球權威大模型評測基準榜單LMSYS大模型競技場 Chatbot Arena和LiveBench前列，皆位列中國大模型第一。
其中，Step-1V在LMSYS Chatbot Arena上，總分跟 Gemini-1.5-Flash-8B-Exp-0827 持平；Step-2在LiveBench榜單上的成績逼近 OpenAI 的 o1-mini-2024-09-12，超越 gpt-4o-2024-08-06 等國際主流模型，也是唯一進入榜單前十名的中國語言大模型。
（圖片來自 LiveBench 官網，截至今年11月19日數據）
“狂飆”600余天，階躍星辰建立全面模型矩陣
11月30日，OpenAI將迎來AI聊天機器人ChatGPT發布兩周年之日。
回顧過去兩年，ChatGPT引爆了全球新一輪 AI 大模型“造模”熱潮。《全球數字經濟白皮書（2024年）》報告顯示，目前，全球AI大模型數量已達1328個，其中美國占比最多達44%，中國占36%，這兩個國家已經牢牢占據大模型領域的第一梯隊。
全球AI大模型市場的競爭格局日益激烈。
在這一輪生成式AI熱潮中，國內最先起跑的是創業公司。成立于2023年4月的階躍星辰，在600多天的時間里，已形成行業領先的綜合技術實力。
包括近期低調內測的Step-Video在內，階躍星辰已經推出了Step系列通用大模型矩陣，涵蓋從千億到萬億參數、從理解到生成、從語言到多模態的全方位能力：
Step-1千億參數語言大模型：兩個月一次性訓練成功，已完成充分打磨，在邏輯推理、中文知識、英文知識、數學、代碼方面的性能全面超越 GPT-3.5。 Step-1V多模態大模型：性能比肩 GPT-4V，可以精準描述和理解圖像中的文字、數據、圖表等信息，并根據圖像信息實現內容創作、邏輯推理、數據分析等多項任務。 Step-2 萬億參數語言大模型：采用MoE架構，聚焦深度智能的探索，這是國內首個由創業公司發布的萬億參數語言大模型。Step-2 在語言生成上對細節有極強的控制力，模型能夠更好地理解和遵循人類指令。 Step-1.5V多模態大模型：在Step-1V的基礎上進行了迭代，具備更強大的多模態理解能力，實現了從圖像理解到視頻理解的跨越升級。 Step-1X圖像生成大模型：具有強大語義理解與圖像創意實現能力，可用于各種圖像創作和設計任務。 Step-Video視頻生成大模型：支持文生視頻，可生成 1080P 長達 10s 的高清視頻，在語義理解、指令遵循、運動、中國風美學生成上效果突出。目前模型已經接入“躍問視頻”并開始內測。
從上述兩個demo片段中，我們可以看到，無論是語義理解能力，細節運動符合物理規律，還是清晰度，階躍星辰的Step-Video視頻生成模型均達到業界先進水平。
事實上，在大模型“六小虎”中，階躍星辰以多模態模型技術實力強勁著稱。根據階躍星辰創始人、CEO姜大昕的規劃，階躍星辰實現AGI的技術路線是：“單模態 — 多模態 — 多模理解和生成的統一 — 世界模型 — AGI”。
他曾多次強調，只有解決了多模態理解生成一體化，才能徹底建立一個世界模型，再往后才能跟具身智能結合，最終實現AGI，以此提升社會、經濟產業的能力與價值。
2028年超4萬億規模，大模型加速技術落地
據研究機構IDC最新數據顯示，預計到2028年，全球 AI 產業支出將達到6320億美元（約合人民幣4.58萬億元），幾乎是當前的兩倍，5年間復合年增長率 (CAGR) 達29%。
其中，生成式AI成為最大的增長引擎，到2028年該領域投資支出高達2020億美元，占整個 AI 支出的32%，CAGR達59.2%。
不過，當前生成式AI產業仍處于非常早期的階段。
中國工程院院士、北京大學博雅講席教授、鵬城實驗室主任高文認為，如果以“人”來相比，AGI現在可能還是剛剛會走路的幼兒狀態。但從使用角度看，AI已經能解決生產、社會、服務的問題，可以先用起來，沒有必要等到十全十美再去用，要把它逐步的開發、完善、迭代。
越來越多的開發者和企業開始基于階躍星辰的大模型矩陣打造AI應用。階躍星辰開放平臺逐漸形成了一個大模型“生態伙伴圈”。金融財經、內容創作、消費娛樂等領域的頭部機構紛紛跟階躍星辰達成技術合作。其中，財聯社跟階躍星辰共同打造了國內首個千億參數多模態金融大模型“財躍F1金融大模型”。
開發者則通過階躍星辰的 Step 系列大模型嘗試新的產品形態。獨立開發者趙純想將包括網紅AI應用“胃之書”在內的三款產品都接入了階躍星辰 Step 系列大模型，原因是胃之書早期對國內所有大模型做了產品 AB test 測試，他發現使用階躍星辰的模型，用戶付費率最高；AI 心理療愈應用“林間聊愈室”則是基于階躍星辰多模態大模型的圖片理解能力，上線了呼聲已久的 AI 識圖功能，用戶可以跟小動物分享自己的生活場景、狀態等，林間聊愈室CEO李神龍表示，接入新功能之后，比較明顯的是付費率確實上漲了。
下一步，我們相信，階躍星辰這類堅持AGI底層技術探索，加速模型應用落地的公司，將成為AGI時代的關鍵“推手”，同時也是AGI產業的技術領先者。
智能階躍，十倍每一個人的可能。
（本文首發于鈦媒體App，作者｜林志佳，編輯｜胡潤峰）

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

時間的“相對論”：為什么我們總覺得時間越跑越快？『心靈加油站』（271）

VC為何關心比鄰星之旅？滴水湖畔“仰望星空”，上海這樣求解未來

《電腦愛好者》雜志公眾號注銷、官網無法訪問，創刊至今已32年

剛說淘汰中國激光雷達，最后希望的 Luminar 就破產了？

王力宏伴舞機器人高難度后空翻后穩穩落地，馬斯克點贊！

長城歐拉出奇招：“一車多動力”打破單點競爭

全站最新

時間的“相對論”：為什么我們總覺得時間越跑越快？『心靈加油站』（271）

VC為何關心比鄰星之旅？滴水湖畔“仰望星空”，上海這樣求解未來

《電腦愛好者》雜志公眾號注銷、官網無法訪問，創刊至今已32年

剛說淘汰中國激光雷達，最后希望的 Luminar 就破產了？

熱門推薦

時間的“相對論”：為什么我們總覺得時間越跑越快？『心靈加油站』（271）

VC為何關心比鄰星之旅？滴水湖畔“仰望星空”，上海這樣求解未來

《電腦愛好者》雜志公眾號注銷、官網無法訪問，創刊至今已32年

剛說淘汰中國激光雷達，最后希望的 Luminar 就破產了？

王力宏伴舞機器人高難度后空翻后穩穩落地，馬斯克點贊！

長城歐拉出奇招：“一車多動力”打破單點競爭

上饒農商行被罰240萬，上饒銀行被罰170萬

2025年流星雨迎來謝幕演出小熊座流星雨22日極大

雷軍轉發！小米汽車又獲獎再引發輿論安全追問

鴻蒙正奔騰！解碼中國自主操作系統的生態成熟好用的極限突圍

我國成功發射通信技術試驗衛星二十三號

寶馬3系全球產量突破1800萬輛，50年傳奇仍在繼續

降息，突發！集體拉升，近8萬人爆倉！

給AI一雙眼睛：XR眼鏡正在重塑下一代智能終端

摩爾線程技術路線圖全面公開！刷新國產GPU推理天花板，新架構能效飆10倍