8 月 27 日消息,智譜 AI 今日宣布,GLM-4-Flash 大模型免費開放,通過智譜 AI 大模型開放平臺調用。
GLM-4-Flash 適用于完成簡單垂直、低成本、需要快速響應的任務,生成速度能達到 72.14 token/s,約等于 115 字符/s。
GLM-4-Flash 具備多輪對話、網頁瀏覽、Function Call(函數調用)和長文本推理(支持最大 128K 上下文)等功能,同時支持包括中文、英語、日語、韓語、德語等在內的 26 種語言。
官方表示,通過采用自適應權重量化、多種并行化方式、批處理策略以及投機采樣等多種方法,在推理層面實現模型的延遲降低與速度提升,更大并發量和吞吐量不僅提升了效率,而且讓推理成本顯著降低,從而免費推出。
在預訓練方面,官方引入了大語言模型進入數據篩選流程,獲得 10T 高質量多語言數據,數據量是 ChatGLM3-6B 模型的 3 倍以上;同時采用了 FP8 技術進行預訓練,提高了訓練效率和計算量。
附相關鏈接如下:
體驗地址:https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash 說明文檔:https://open.bigmodel.cn/dev/api#glm-4





京公網安備 11011402013531號