快科技11月4日消息,昨日,美團LongCat(龍貓)團隊正式推出全新開源大模型LongCat-Flash-Omni。
該大模型總參數規模高達5600億,實現全模態能力突破,登頂開源領域最先進水平(SOTA)。
![]()
今年9月1日,美團正式發布LongCat-Flash系列模型,并開源了LongCat-Flash-Chat和LongCat-Flash-Thinking兩大版本。
此次LongCat-Flash-Omni是系列全新家族成員。它也是業界首個實現"全模態覆蓋、端到端架構、大參數量高效推理"于一體的開源大語言模型,首次在開源范疇內實現了全模態能力對閉源模型的對標。
![]()
該模型的核心突破在于破解了"大參數與高效率"的行業矛盾。
該模型總參數達5600億(激活參數270億),卻依托LongCat-Flash系列創新的ScMoE架構(含零計算專家)作為LLM骨干,結合高效多模態編解碼器和"分塊式音視頻特征交織機制",最終實現低延遲、高質量的音視頻處理與流式語音生成。
模型支持128K tokens上下文窗口及超8分鐘音視頻交互,在多模態長時記憶、多輪對話、時序推理等能力上具備顯著優勢。
![]()
實測顯示,其圖像理解性能與閉源全模態模型 Gemini-2.5-Pro 相當,且優于開源模型 Qwen3-Omni。短視頻理解性能超越同類模型,長視頻處理能力比肩Gemini-2.5-Pro。
落地體驗上,LongCat官方App現已正式發布,支持聯網搜索,還可以發起語音通話(視頻通話功能敬請期待)。
![]()





京公網安備 11011402013531號