作者 | 柴旭晨
編輯 | 周智宇
螞蟻醞釀多時的金融大模型,終于落地了。
7月28日,在世界人工智能大會論壇上,螞蟻數科正式發布金融推理大模型Agentar-Fin-R1。
據了解,Agentar-Fin-R1基于Qwen3研發,在Fineval1.0、FinanceIQ等金融大模型評測基準上超越Deepseek-R1等同尺寸開源通用大模型以及金融大模型,顯示其更強的金融專業性、推理能力以及安全合規能力。
眼下,大模型在金融領域的應用正如火如荼。螞蟻數科副總裁余濱向華爾街見聞表示,現在AI的進展已經到達了重要的拐點時期,“如果金融機構抓住了,很可能給自己帶來彎道超車的優勢。反之很可能虛耗掉過去十年來在數字化建設時期打下的先機”。
然而在實際業務場景中,現有的大模型在解決真實金融任務時仍然存在諸多挑戰,它需要高度專業的金融知識、復雜的業務邏輯推理能力以及符合嚴格的金融級安全合規等要求。顯然,專業化的金融推理大模型是必然需求。
“通用大模型距離產業實際應用存在‘知識鴻溝’。構建專業的金融大模型是推進金融與AI深度融合的必然路徑,未來,金融大模型的應用深度將成為金融機構競爭力的關鍵要素。”螞蟻數科CEO趙聞飆如是說道。
螞蟻數科金融推理大模型的核心競爭力在哪里?首先是基于更專業全面的金融數據訓練體系,讓模型“出廠即專家”。
螞蟻方面指出,訓練行業大模型需要對行業知識進行系統化的學習,其關鍵在于一個科學、專業的任務數據體系作為“課程大綱”。基于長期深耕金融業務的經驗,螞蟻數科整理并制定了覆蓋銀行、證券、保險、基金、信托等全場景的金融任務體系。
以該金融任務體系為框架,從千億級交易、風控和財富等場景中積累的真實原始數據出發、經過嚴格的質量評估、再經過專門設計的可信數據合成和CoT數據精標鏈路,構建了迄今已知最專業最全面的金融領域訓練數據集。
此外,通過加入原則類合成數據,確保大模型在所有任務中都遵循金融業的安全合規要求,以應對例如身份類、合規性、數據安全等問題,提升大模型的安全合規性。
經過專業體系數據集訓練的金融大模型,能夠達到“出廠即專家”,不僅在多個主流金融評測集上達到同尺寸最佳效果,更要考察實用能力的典型金融智能體應用中體現出更強的自然語言理解NLU、自然語言生成NLG、FC和幻覺抑制能力,確保金融決策場景的事實精確性與認知可靠性。模型還嚴格遵循金融監管框架與倫理準則。
此外,螞蟻發布的金融大模型具備更高效的加權訓練算法。螞蟻方面指出,在后續業務應用中可減少二次微調的數據需求與算力消耗,降低大模型落地企業的門檻與成本。
關鍵的是,Agentar-Fin-R1是能自主進化的大模型,時刻保持最新、最穩。
除了使用RAG技術補充動態知識外,上述金融任務體系和金融大模型本身能持續迭代,不斷吸收更新金融政策、市場動態、產品條款等關鍵信息,并完善金融任務體系,識別模型能力的實時缺口和潛在認知偏差,確保知識、能力和合規性始終緊跟行業變化。
據悉,Agentar-Fin-R1包括32B和8B參數兩個版本。螞蟻數科還推出基于百靈大模型的MOE架構模型,獲得更優推理速度。此外,還有非推理版本的14B和72B參數大模型,以滿足金融機構在多樣化場景下的部署需求。
目前,螞蟻數科累計已服務100%的國有銀行和股份制銀行、超60%的地方性商業銀行、數百家金融機構。“在大模型時代,我們值得用AI去重塑全部的業務流程”,螞蟻數科AI原生產品總經理王磊向華爾街見聞說道。





京公網安備 11011402013531號