![]()
新智元報道
編輯:元宇 好困
DeepSeek在港大「AI-Trader」項目中以9.68%收益率擊敗GPT、Claude、Gemini等全球頂級模型,成為能夠在真實美股市場實現自主盈利的AI交易系統,這標志著AI在金融實盤應用中的重大突破。
這一局,中國AI又贏了!
繼AlphaArena在加密貨幣市場掀起AI大戰之后,一場更硬核的「美股版AI魷魚游戲」已經落幕。
就在剛剛,最新戰報出爐,結果震撼全場:
中國的DeepSeek成為最大黑馬,收益率高達9.68%。
這意味著,通過它賺錢速度是直接買熱門美股基金(QQQ)的8倍,是第二名AI大模型的4倍!
![]()
![]()
GitHub地址:https://github.com/HKUDS/AI-Trader
Leaderboard:https://hkuds.github.io/AI-Trader/
在這個名為「AI-Trader」的開源項目中,來自港大黃超教授的研究團隊進行了一次有趣的探索——
他們給GPT、Claude、Gemini、Qwen、DeepSeek這五個全球頂級AI模型每人1萬美金,到納斯達克100成分股交易市場廝殺近一個月。
同時,為這場比賽制定了堪稱嚴苛的規則:沒有人工干預,沒有策略預設,也沒有任何人為提示。
每個AI模型,只有自己的賬戶資金和一套用來查股價、搜新聞、下單的交易工具。
至于要怎么交易,全憑AI模型的智商了。
這不是你見過的「AI炒股」
首先需要說明的是,這是一場真正的AI自主交易!
它不是程序員預先寫死的「偽AI交易」,也不是拿歷史數據跑出來的「炒股機器人」。
項目團隊為這個實驗定下了「三不原則」:
不給劇本:不告訴AI任何炒股套路;
不給建議:全程禁止人工「場外指導」;
不給作弊機會:嚴格按日期過濾數據。
設想你交給AI一萬美元和一套交易工具,然后讓它獨立操作一個月,看能否盈利。
整個過程沒有策略模板,沒有技術指標,AI只能靠自己搜索和分析信息,計算風險收益,并做出購買決策。
因此,此次DeepSeek的勝出完全是依靠模型自身的學習和推理能力。
![]()
![]()
從DeepSeek的持倉截圖可以看出,它沒有盲目追熱點或All-in單只股票,而是展現出了超越多數散戶的投資策略:
精準踩中科技龍頭:比如NVDA、AAPL、MSFT等核心標的;
有效分散投資風險:采用了多標的投資組合,不把雞蛋放進一個籃子里;
動態調倉能力:根據市場變化實時調整。
交易行為暴露AI「性格」
誰是老司機,誰心態崩了?
更有意思的是,交易頻率的差異也暴露出了這些參賽AI各自迥異的「性格」。
![]()
從這些「AI交易員」的性格畫像中,我們也能琢磨出來一些現實炒股中的門道:
首先,頻繁交易≠高收益。
Gemini在短期內進行了高頻交易,瘋狂下單73次,因缺乏風險控制導致虧損2.73%,呈現出典型的高頻波動型策略失效特征。
這像極了那種每天盯盤八小時,一有波動就慌忙操作的散戶,最后心態崩了就直接清倉走人。
![]()
第二,太佛系了也不行。
Qwen只交易了22次,結果還是拿了負收益。
![]()
第三,只有穩健才是王道。
DeepSeek和Claude的交易次數都在50次左右,理性穩健,該出手時就出手。
它們一個大賺9.68%,一個小賺2.17%——這才是成熟交易員該有的節奏。
![]()
![]()
這場實驗不僅測出了AI的「智商」,還測出了它們的「情商」和「心態」,而這恰恰也是金融市場最考驗人的地方。
完全開源
一鍵就能讓AI幫你炒股
更炸裂的是AI-Trader完全開源,MIT協議、代碼全公開。
只需下面三步就可以輕松上手:
克隆倉庫:只要一行命令就可以;
配置API:Alpha Vantage、Jina、OpenAI等,大部分都有免費額度;
一鍵啟動:python main.py,然后就可以坐等AI開始交易。
此外,項目還支持可插拔的擴展:
時光機模式:回到2024年科技股暴跌期,看你的AI能不能成功抄底;
DIY專屬AI交易員:如果覺得GPT太保守,還可以自定義一個激進派的Agent;
擴展到全球市場:A股、港股……理論上都可以接入。
想訓練好一個AI
最好的方法是將它扔進股市
多年來,我們一直采用靜態基準來衡量AI。
比如通過ImageNet測圖像識別,MMLU測知識問答等。
但這些測試都有一個致命缺陷:它們都發生在一個可預測、可以隨時按暫停鍵的「實驗室環境」中。
為了打破這一慣例,10年前,DeepMind引入了游戲場景來進行AI測試。
不是讓AI去做MMLU選擇題,而是讓它在《星際爭霸》里與職業選手對戰,或者在圍棋中與世界冠軍競爭。
DeepMind之所以這樣做,是因為游戲提供了傳統測試中所沒有的三個挑戰:
動態環境:每一局都不一樣,對手也會學習、會反擊;
即時反饋:走錯一步棋,就可能立即輸掉比賽;
開放策略:沒有標準答案,只有輸贏。
于是我們看到了AlphaGo、AlphaStar,也看到了AI從「會答題」進化到「能博弈」。
從靜態基準測試到游戲測試,難度是提升了,但仍然不夠。
如果說游戲測試是AI的「新手局」,金融市場才是滿級玩家們要挑戰的終極BOSS。
原因很簡單:市場是一個比游戲更好的訓練場。
游戲再復雜,它的規則也是固定的。
相比規則固定的游戲,金融市場的復雜性在于其參與者與規則的動態共演。
它是一個由無數人(包括智能體)共同組成的一個持續進化的復雜系統,它有博弈、欺騙、陷阱、絞殺,也會波動、反應、懲罰、獎勵。
所以,市場才是AI的終極試金石。
一個AI的智能不僅取決于它讀取信息的速度,更取決于它能夠承認錯誤、及時止損的自我反省與學習能力。
這才是真正的智能,也只有通過股市中真金白銀的搏殺才能檢驗出來。
正因如此,市場才是終極的世界建模引擎。
想要訓練一個真正能在現實世界運行的AI,最好的辦法把它扔進股市,它必須在這里學會:
從嘈雜的信息海洋中捕捉有效信號;
綜合財報、技術指標、輿情分析做出多維決策;
隨著市場變化不斷調整策略;
知道及時止損。
這衡量的是AI在不確定性環境中生存的能力,這才是新時代的圖靈測試。
AI戰場
早已不只在聊天框里了
如果說過去十年,DeepMind用游戲證明了AI可以戰勝人類,那么接下來的十年,金融市場將證明「AI可以在真實世界中創造價值」。
它拓展了我們探索AGI的邊界,打開了AI通往真實世界的通路。
想象一下,當AI能在復雜的市場環境下生存,今天能夠炒股,明天就可以做醫療診斷、法律分析、科研決策,去解決更多現實場景中的問題。
另外一個方面,市場也為AI提供了開放式學習的環境,近乎無限的數據和即時反饋,這是實驗室中永遠也無法模擬出來的。
當硅谷還在爭論「AI會不會搶了基金經理飯碗」時,中國的DeepSeek已經用真金白銀的9.68%收益率給出了答案——不是會不會,而是已經在發生了。
DeepSeek的勝利,象征著一種范式轉變:
未來的華爾街,可能不再屬于那些時刻盯盤的交易員,而是屬于那些能秒讀千份財報、精準捕捉市場情緒、永不情緒化的AI大腦。
而引領這場金融AI革命浪潮的,正是來自中國的DeepSeek。
從AI聊天(ChatGPT vs Kimi、DeepSeek),到深度研究(OpenAI DeepResearch vs Qwen DeepResearch),再到現在的AI炒股——每一個新戰場打開,我們都能看到中國AI的身影在快速逼近,甚至反超。
AI的戰場早就不只在聊天框里了。
而如今,中國AI正在開啟這個未來。
作者介紹
![]()
范天宇
范天宇(2002年生),香港大學博士二年級學生,研究方向為檢索增強生成(RAG)與大語言模型智能體。
學術成果發表在ICLR會議,并主導開源項目MiniRAG(GitHub 1.5k星),在學術與產業界獲得廣泛應用與關注。
![]()
蔣楊欽
蔣楊欽(1999年生),香港大學博士四年級學生,研究方向涵蓋大模型智能體、圖學習與推薦系統。
研究成果入選KDD 2022最有影響力論文榜單,并獲得ACM MM 2024 Best Paper Honorable Mention Award。
![]()
楊雨豪
楊雨豪(2000年生),香港大學博士四年級學生,谷歌學術引用1800+。主要研究方向為大模型智能體、圖學習與推薦系統。
成果多次入選頂級會議最有影響力論文榜單(KDD 2022/2023、WWW 2023、SIGIR 2022)。開源多模態GUI智能體Aria-UI在學界與業界獲得關注。
![]()
黃超
黃超,香港大學博士生導師,研究方向大語言模型、智能體與圖機器學習,Google Scholar引用1.3萬+。
團隊推出LightRAG、RAG-Anything、DeepCode、AutoAgent、AI-Researcher、MiniRAG、VideoRAG等開源項目,累計6萬余GitHub星標、50次登上GitHub Trending。
曾獲2024前沿科學獎,并入選2025 AI100青年先鋒與AI 2000全球最具影響力學者。
多項成果在KDD、WWW、SIGIR、AAAI等頂會被評為最具影響力研究之一,并于ACM MM、WWW、WSDM等獲得最佳論文提名。
參考資料:
https://github.com/HKUDS/AI-Trader





京公網安備 11011402013531號