當業界探討智能體功能、開發環境時,近日北京智譜華章科技股份有限公司(以下簡稱"智譜")低調發布新一代旗艦大模型GLM-4.5,這是一款專為智能體應用打造的基礎模型,在復雜推理、代碼生成及智能體交互等通用能力上實現能力融合與技術突破。OpenAI"跳票"多次的GPT-5也強調融合,并在6月底將智譜列入全球競爭對手,沒想到智譜率先登場,GLM-4.5的綜合得分位列全球第三、國產第一。
在資本市場,智譜也是"沉默的領跑者",4月已在北京證監局辦理上市輔導備案,由中金公司擔任輔導機構,成為第一家啟動IPO上市的"大模型六小虎"。根據輔導備案報告,8月智譜將進入正式輔導期第二階段,在這期間,這家脫胎于清華的大模型公司還密集收獲多地國資的戰略投資。從實驗室到產業,智譜走出了中國通向AGI(通用人工智能)的另一條路徑。
![]()
全球第三,國產第一
最近的開源浪潮中,智譜的GLM-4.5發布僅2小時,就被X平臺推薦上了首頁,發布12小時后,它已經位列國際開源社區Hugging-Face榜單全球第二,創增速紀錄。
在涵蓋研究生水平推理和復雜軟件工程解題等12項全球公認的硬核測試中,GLM-4.5的綜合得分位列全球第三,在所有國產模型和開源模型中均排名第一。
GLM-4.5采用混合專家(MoE)架構,GLM-4.5總參數量3550億,激活參數320億;GLM-4.5-Air總參數1060億,激活參數120億,有用于復雜推理和工具使用的思考模式,及用于即時響應的非思考模式。在包含推理、代碼、智能體的綜合能力測評中,GLM-4.5達到開源SOTA(即"當前最佳技術"或"最前沿水平"),在真實代碼智能體的人工對比評測中,實測國內最佳。
真實場景表現比榜單更重要。在真實場景Agentic Coding(Agentic Coding)中,52個編程開發任務,涵蓋六大開發領域的測試中,GLM-4.5與Claude Code、Claude-4-Sonnet、Kimi-K2、Qwen3-Coder進行對比測試,結果顯示,GLM-4.5相對其他開源模型展現出競爭優勢,特別在工具調用可靠性和任務完成度方面表現突出。盡管GLM-4.5相比Claude-4-Sonnet仍有提升空間,在大部分場景中可以實現平替的效果。
在成本角度,GLM-4.5的API調用價格輸入0.8元/百萬tokens、輸出2元/百萬tokens;高速版最高100tokens/秒。綜合成本和、參數和表現,外界給GLM-4.5以"成本更低、性能更優"的評價。
專為智能體
"效果確實不錯的",體驗GLM-4.5后,某大模型六小虎的一位技術專家向北京商報記者反饋,他特別提到效果是指"使用這個模型開發Agent(智能體)"。這也是GLM-4.5的特點。
據了解,GLM-4.5模型能夠勝任全棧開發任務,一鍵生成較為復雜的應用、游戲、交互網頁。在實際例子中,用戶通過z.ai使用該模型時,僅用一句簡單的指令,就可讓GLM-4.5獨立開發出具備搜索功能的"谷歌"網站、可以發彈幕的"B站",甚至直接上線一個完整的"Flappy Bird"小游戲。
簡單來說,GLM-4.5的最大亮點是這是首款原生融合模型,首次在單個模型中實現將推理、編碼和智能體能力原生融合,以滿足智能體應用的復雜需求。
大語言模型的目標是在廣泛領域達到人類認知水平。然而,現有模型仍然算不上真正的通用模型:有些擅長編程,有些精于數學,有些在推理方面表現出色,但沒有一個能在所有任務上都達到最佳表現。GLM-4.5正是朝著統一各種能力這一目標努力,力求在一個模型中集成所有這些不同的能力。大模型的下一個范式,一定是把各種能力整合到一起,成為一個"全優生"。
巧合的一點是,6月智譜曾被OpenAI"點名",將其定義為全球競爭對手。對于類似GLM-4.5的融合式模型,OpenAI也早有提及。
2024年1月,OpenAI CEO山姆·奧特曼曾在接受媒體采訪時提到,他現在的首要任務是推出可能被稱為GPT-5的新模型,并稱GPT-5將能夠比現有模型做更多的事情。2025年2月13日,他宣布,OpenAI將在未來幾個月內推出名為GPT-5的模型,該模型將整合OpenAI的大量技術,包括o3,并應用于聊天機器人ChatGPT以及API平臺。此后,OpenAI高管曾透露7月是GPT-5目標推出時間,后來山姆·奧特曼將這個時間推遲到8月初。
成為"全優生"
這一切讓外界不禁好奇,智譜與OpenAI有哪些異同?針對這個問題,智譜CEO張鵬在接受媒體采訪時表示,相似之處在于雙方都在各自國家較早地開始訓練大模型。雙方都努力探索不同方向的能力邊界。
"大家都不知道人工智能的邊界到底在哪里。OpenAI在2023年后探索了很多方向,比如o系列模型。我們也在探索各種各樣的模型,例如我們此次發布的首個原生融合模型,就代表行業一個新的發展方向。"他進一步說,現有模型仍然算不上真正的通用模型:有些擅長編程,有些精于數學,有些在推理方面表現出色,但沒有一個能在所有任務上都達到最佳表現。GLM-4.5正是朝著統一各種能力這一目標努力,力求在一個模型中集成所有這些不同的能力。大模型的下一個范式,一定是把各種能力整合到一起,成為一個"全優生",就像人一樣,擁有越來越通用的能力。
拋開技術,在外界眼中智譜的學術背景在一眾同行中更突出。"智譜作為脫胎于清華的大模型公司,其核心優勢主要體現在技術積累和產學研結合方面。"科方得智庫研究負責人張新原向北京商報記者表示,"獲得多地國資戰略投資也顯示出智譜在資源整合和政策支持方面的優勢。"
北京社科院副研究員王鵬也提到了智譜的股東,"它的股東背景多元,這樣可以讓智譜同時獲得應用場景、政務資源、國際市場等支持"。
作為正在上市路上的大模型創業公司,恰逢風頭正盛的具身智能也正奔赴資本市場,會否受到影響?王鵬告訴北京商報記者,"具身智能聚焦機器人、物理世界交互,智譜專注通用大模型與智能體,兩者在應用場景、技術棧、客戶群體差異顯著,直接競爭較少。具身智能目前處于概念驗證階段,商業化路徑尚不清晰,而智譜商業模式相對成熟"。
北京商報記者 魏蔚





京公網安備 11011402013531號