12月23日,百川智能全鏈路領域增強大模型Baichuan4-Finance正式發布。不同于行業常見的大語言模型,Baichuan4-Finance主要面向金融領域,但并未放棄通用能力。
在FLAME-Cer評測中,Baichuan4-Finance整體準確率高達93.26%,領先GPT-4o近20%,其中銀行、保險、基金、證券等多個項目的從業資格認證測試中,Baichuan4-Finance準確率更是達到了95%以上。

(圖源:百川智能)
在更偏向一級應用場景的FLAME - Sce和國內主流開源金融評測基準FinanceIQ兩大評測中,Baichuan4-Finance整體成績均優于GPT-4o和開源金融大模型XuanYuan3-70B-Chat。
據百川智能介紹,為實現模型在提升專業能力的同時,不損失通用能力,百川智能專門打造了一套全鏈路領域增強方案,行業首創領域自約束訓練技術,涵蓋高質量數據集構建、模型預訓練、微調、強化學習等流程。Baichuan4-Finance正是該方案的最新成果,其高質量金融數據集全面嚴謹,包含核心專業金融知識數據及實踐應用類數據,為提升金融能力提供良好支撐。

(圖源:百川智能)
此外,百川智能還在領域自約束訓練中引入高精通用數據混合訓練,以確保通用能力能夠穩步增長。后訓練環節,百川智能通過合成數據、指令數據進行有監督微調,針對金融領域特定場景進行樣本增強,進一步提升了大模型的性能表現。
對于Baichuan4-Finance,軟通動力表示,該大模型的通用能力和專用能力均完美契合他們的需求,部署該大模型后,用戶滿意度提升了20%。
在大模型普及度日益提高的今天,如何權衡大模型的專業能力和通用能力已成為令AI企業頭疼的難題。若使用大量通用數據訓練大模型,很可能造成數據污染,降低大模型在專業領域的準確性,而不使用通用數據訓練大模型,則可能導致大模型的通用能力增長停滯乃至下降。
百川智能通過行業首創的自約束訓練技術和全鏈路領域增強方案,以專業金融知識和實踐應用類數據訓練大模型,用于提升Baichuan4-Finance面對金融領域專業應用場景時的能力。特選高精通用數據用于混合訓練,則能夠在避免外部數據污染的同時,提升AI大模型的通用能力。

(圖源:百川智能)
該方案對于AI企業的數據樣本篩選、算法、監督和調整能力提出了極高的要求,從多項測試表現來看,Baichuan4-Finance在金融領域的能力已躋身第一梯隊,遠超GPT-4o和XuanYuan3-70B-Chat。
百川智能表示,已與華為、中科曙光、軟通動力、達觀數據、中國移動/電信/聯通等軟硬件公司及運營商達成合作,為愛奇藝、完美世界游戲、360集團等數千家企業提供了服務。
通用大語言模型競爭烈度較高,且難以實現盈利創收,AI公司為大模型加入專業能力,面向特定人群是行業趨勢。率布局金融領域的百川智能,或將通過Baichuan4-Finance奠定行業地位,與更多企業達成合作,并為個人用戶提供更加完善的使用體驗。





京公網安備 11011402013531號