
進入2025年8月后,A股市場保持強勢,多個指數盤中齊創多年新高。截至8月18日收盤,上證指數上漲0.85%報3728.03點,盤中最高觸及3745.94點,創下近十年新高;深證成指漲1.73%,盤中最高觸及11919.57點,創下近兩年來新高;創業板指漲2.84%;北證50漲6.79%,刷新歷史新高,科創50漲2.14%。A股全天成交2.81萬億元,較上一交易日大幅放量。
在市場一片沸騰的背后,一個問題也隨之浮現:在AI飛速發展的今天,為什么沒有任何一個公開的大模型,能夠提前預測到這樣一場波瀾壯闊的行情?而且,既然牛市已經到來,那么大模型能否預測這輪牛市會持續多久?
大模型可以分析過去幾十年的牛熊轉換,識別出一些典型的衰退信號,比如成交量異常放大、估值泡沫化、關鍵技術指標背離等。然而大模型卻無法正確預測下一次牛市或者熊市。
網上經常會有人售賣大模型炒股以及做量化交易的教程,但是即便是你一步一步地按照他的方式來,也依然賺不到錢,這又是為什么?
01
金融大模型的發展可以追溯到2023年,那一年也是大模型的“開元之年”。當時最具標志性的金融大模型是彭博社發布的BloombergGPT。
BloombergGPT是彭博社利用其數十年積累的、高質量且完全專有的金融文本數據所開發的信息交流工具。這些數據包括了海量的金融新聞、上市公司的財務文件、專業的市場研究報告,甚至包含了彭博終端內部用戶之間交流產生的匿名化數據。
這種數據既獨特,而且質量高,使得BloombergGPT在誕生之初就具備了對金融語境的深刻理解能力。它能夠精準識別金融術語、理解實體之間的復雜關系,并對市場情緒做出比通用模型更準確的判斷。
其主要任務是執行金融領域高度專有的任務:進行更細粒度的情緒分析、從海量公告中精準識別關鍵的命名實體、對新聞進行深度分類,以及實現對財務報表的智能問答。對于量化交易者而言,BloombergGPT的輸出的每一個交易建議,都具有極高的高價值。
它的出現,成為了當時的行業標桿。
因此,BloombergGPT的缺點也同樣明顯。成本高昂、系統封閉,普通個人開發者和小型機構完全無法觸及。其模型內部的運作機制是一個黑箱,使用者只能接受其輸出結果,而無法對其進行定制或深入研究,這對于追求策略透明度和自主性的量化研究者來說是一個限制。

進入2024年,市場格局發生了顯著變化。隨著技術的快速迭代,大模型的上下文長度、生成內容的一致性和邏輯推理能力都得到了顯著提高。同時,各大互聯網與科技巨頭紛紛開源或發布了自己強大的基礎模型,這極大地降低了技術門檻,使得金融大模型的開發進入了一個百花齊放的階段。
市場上涌現出大量或開源或商業化的大模型,它們能生成代碼,能分析新聞,還能進行市場預測。然而,一個普遍的現象是,盡管模型在處理文本、生成代碼等任務上的能力有所提高,但它們在最核心的金融預測性方面的提升,卻小得可憐。
這種技術進步與金融實效之間的脫節,源自于當時大模型還并不能理解金融數據。金融市場數據的“低信噪比”特性。與語言或圖像數據不同,金融價格序列中包含了大量的隨機波動,即“噪聲”,而能夠真正預示未來方向的“信號”則極其微弱。大模型雖然擅長發現模式,但在這種環境下,它極易將噪聲誤認為是信號,從而產生“過擬合”。換句話說,模型在歷史數據上看似找到了規律,但在真實的未來預測中卻即刻失效。
時間推進到2025年,隨著具備高級推理和工具調用能力的“AI智能體”(Agent)技術走向成熟,金融預測的探索進入了一個新的階段。開發者們不再執著于訓練一個單一的、端到端的預測模型,而是轉向構建一個由智能體驅動的自動化分析工作流。人們更愿意相信這種模式,因為它看起來更像人類專家的工作方式:分解問題、搜集信息、分析推理、得出結論。
在這種新范式下,類似n8n這樣的無代碼工作流自動化平臺成為了核心工具。開發者可以設計一個復雜的金融分析流程,并讓一個AI智能體來執行它。
這種基于智能體和工作流的方法,相比于早期的單一模型,開發者可以清晰地看到每一步的輸入和輸出,便于調試和優化。然而,即便如此,它依然沒有解決金融預測的根本性難題,反而以新的形式暴露了這些問題。
由于需要經過多步的調用,整個工作流的響應時間要比大模型慢,即便完全自動化,執行完畢也需要秒級甚至分鐘級的時間。在這個時間內,專業的量化對沖基金已經利用更底層的技術,完成了對初始新聞事件的納秒級反應。智能體得出的結論,在誕生的那一刻就已經過時了。而此時,這個智能體給出答案的正確與否,就不太重要了。
正是因為清醒地認識到了這些根本性難題,到了2025年,業界的焦點已經從不切實際的“市場預測”,全面轉向了更務實的“工作流增強”。大模型不再被視為能夠預測未來的“水晶球”,而是被定位為賦能專業人士的“超級工具”,即“插件”。這類工具不再嘗試給出買賣建議,而是深度集成到研究員的工作流程中,幫助他們更快地處理數據、生成代碼、驗證想法、撰寫報告,將人類從重復性勞動中解放出來,專注于更高層次的策略創新和邏輯思考。
02
2025年8月,清華大學研究團隊在Gtihub上發布了一個叫做Kronos的開源項目,其目標是利用時間序列大模型來預測金融市場的K線走勢。從項目介紹來看,這是一個典型的、試圖利用大模型在金融市場中直接尋找盈利機會的嘗試。
這個項目的邏輯簡單直接:既然大模型能夠在語言、圖像等領域通過學習海量數據發現復雜的模式,那么它也應該有能力從充滿噪聲的歷史價格數據中,找到預示未來漲跌的規律。
Kronos所采用的時間序列模型,正是一種專門用于處理和分析按時間順序排列的數據點的架構,其設計目標就是捕捉數據在時間維度上的依賴關系和潛在趨勢。具體到金融領域,就是將K線圖中的開盤價、收盤價、最高價、最低價以及成交量等一系列數據點輸入模型,期望模型能輸出對未來價格走勢的概率性預測。

進一步探究該項目的issue區可以發現,使用者普遍對其分析K線得出的結果表示不滿意。這就引出了一個更深層次的矛盾:Kronos模型明明是基于歷史K線數據進行訓練的,為何其預測結果卻無法讓使用者信服,甚至被認為是無效的呢?
在github上,這種開源的大模型金融工具并不少,但實際上并沒有多少程序員能通過這些開源的大模型金融工具賺到了錢。
答案并非隱藏在技術細節中,而是根植于金融市場一個最基本、也是最殘酷的運行法則——策略的“Alpha衰減”。
要理解這個法則,首先需要明白什么是“Alpha”。在投資領域,Alpha是一個核心概念,它指的是投資組合相對于市場基準(例如滬深300指數)所獲得的超額回報。
如果一個投資策略在扣除所有風險因素后,長期穩定地跑贏了市場平均水平,那么我們就說這個策略擁有正的Alpha。尋找Alpha,是所有主動型投資管理者的終極目標。而所謂的“Alpha因子”,就是那些被認為能夠預測未來資產價格走勢,從而帶來超額收益的信號或變量。

這些因子可以是多種多樣的,比如一個公司的市盈率(價值因子),或者一只股票過去一段時間的漲幅(動量因子)。量化交易的本質,就是通過數據分析和統計建模,去發現并利用這些有效的Alpha因子來構建交易策略。
一個有效的策略之所以能夠賺錢,是因為它發現并利用了一個暫時未被大多數市場參與者所察覺或利用的市場無效性或某種規律。然而,金融市場是一個復雜的適應性系統。這意味著,任何能夠穩定盈利的模式,一旦被發現和傳播,就會被迅速地套利,直到其盈利空間完全消失。這就是“Alpha衰減”的核心邏輯。
一個策略發現了一個規律,即每當某個特定類型的公告發布后,相關公司的股價在接下來的一個小時內大概率會上漲3%。最初,只有發現這個規律的交易者能夠利用它來獲利。他可以在公告發布后立刻買入,一小時后賣出,穩定地賺取差價。
但是,這種交易行為本身會在市場上留下痕跡。其他敏銳的交易者會觀察到這種異動,并開始研究其背后的原因。很快,第二個、第三個、乃至成百上千個交易者都會發現這個規律。當所有人都知道這個規律后,競爭就會變得異常激烈。人們不再等到公告發布后才行動,而是會試圖提前預測公告的內容,或者在公告發布后的瞬間以更快的速度下單。
買盤的瞬間涌入會立刻推高股價,可能在幾秒鐘內就將那3%的潛在漲幅完全抹平。最終,這個曾經有效的規律,其預測能力會因為過度擁擠的交易而趨近于零。這個規律的Alpha,就徹底衰減了。
市場的這種“學習”能力,是所有公開策略的天敵。
像Kronos這樣的模型,它試圖從公開的K線數據中學習價格運動的模式。K線數據是市場上最公開、最容易獲取的數據,全世界數以百萬計的交易者和研究員已經用各種可能的方法對其進行了長達一個世紀的分析。其中任何簡單、穩定的線性或非線性模式,都早已被發現和利用,其對應的Alpha也早已衰減殆盡。
大模型雖然擁有強大的非線性擬合能力,但它所學習的原材料,是已經被過度挖掘的公開數據。因此,它很可能只是找到了數據中一些看似存在、實則由隨機性導致的虛假關聯(即過擬合),或者是一些極其微弱、生命周期極短的真實模式。
當用戶試圖用這個模型去預測未來的市場時,這些虛假關聯自然會失效,而那些微弱的真實模式,也可能因為市場的學習效應而在模型發布后的幾天甚至幾個小時內就消失了。
基于大模型的策略,尤其是那些依賴于對某些特定數據(無論是K線、新聞還是財報)的解讀方式的策略,尤其容易受到Alpha衰減的影響。因為一旦其核心邏輯或模型結構被公開,任何人都可以利用強大的算力和現成的AI框架,在極短的時間內復制、驗證并執行這個策略。這使得這類策略的生命周期被極大地縮短了。
這也就解釋了為什么BloombergGPT這類產品之所以曾經能夠成功,是因為它們并不直接提供一個“必勝策略”,而是提供一種更高質量、更及時的專有數據處理服務。機構投資者利用這些經過處理的數據,結合自己獨有的、保密的策略邏輯,去尋找屬于自己的、尚未衰減的Alpha。
因此,程序員群體中很少有人能通過開源的金融大模型工具賺到錢,這并非是因為技術不夠先進,而是因為他們試圖解決的問題,觸及了金融市場最核心的規律。在一個高效的、信息快速流通的市場中,任何公開的、易于復制的工具或策略,都無法成為持續獲取超額收益的鑰匙。真正的Alpha,往往隱藏在獨有的數據、深刻的行業認知、創新的策略邏輯以及對市場結構的深刻理解之中,而這些,恰恰是無法通過一個開源模型直接獲得的。
所以說當你在網上看到那些教你用大模型打造金融工具的視頻或者文章,一個也別信,他們就是靠賣課賺錢的。





京公網安備 11011402013531號