7月28日,在世界人工智能大會論壇上,螞蟻數科正式發布金融推理大模型Agentar-Fin-R1,為金融AI應用打造可靠可優化的智能中樞。該模型基于阿里云Qwen3研發,在Fineval1.0、FinanceIQ等權威金融大模型評測基準上超越同尺寸開源通用大模型以及金融大模型,顯示其更強的金融專業性、推理能力以及安全合規能力。
“通用大模型距離產業實際應用存在‘知識鴻溝’。構建專業的金融大模型是推進金融與AI深度融合的必然路徑,未來,金融大模型的應用深度將成為金融機構競爭力的關鍵要素。”螞蟻數科CEO趙聞飆認為。
據悉,螞蟻數科通過構建全面的金融任務數據體系以及模型訓練算法創新,實現模型更強的金融推理能力及可信性。評測結果顯示:相較于通用開源模型及其他金融模型,Agentar-Fin-R1在Fineval1.0、FinanceIQ兩大主流金融基準測試中均取得最高評分。并且模型在金融能力顯著增強的同時,通用能力也表現出較高水準。
在數據層面,螞蟻數科構建了業內最全面與專業的金融任務分類體系,包括6大類、66小類場景,覆蓋銀行、證券、保險、基金、信托等金融全場景,通過可信數據合成技術以及結合專家標注的金融長思維鏈構造機制,顯著提升模型處理復雜任務的能力。在訓練層面,創新的加權訓練算法,提高大模型對復雜金融任務學習效率與性能。在后續業務應用中,可顯著減少二次微調的數據需求與算力消耗,有效降低大模型在企業落地的門檻與成本。此外,Agentar-Fin-R1還能不斷更新迭代,吸收最新的金融政策、市場動態等關鍵信息,并通過配套評測工具進行針對性優化,讓模型能力在真實業務場景中不斷進化。
據悉,Agentar-Fin-R1包括32B和8B參數兩個版本。螞蟻數科還推出基于百靈大模型的MOE架構模型,獲得更優推理速度。此外,還有非推理版本的14B和72B參數大模型,以滿足金融機構在多樣化場景下的部署需求。
文/北京青年報記者 溫婧
編輯/周超





京公網安備 11011402013531號