![]()
打開百度APP暢享高清圖片
這一局,中國AI(人工智能)又贏了。
北京時間11月4日凌晨,一場備受關注的全球AI投資大賽——Alpha Arena(阿爾法競技場)決出勝負。阿里千問Qwen3Max以超20%的勝率奪冠,同樣盈利的深度求索DeepSeek v3.1位列第二。兩大國產模型是唯二保持正收益的大模型。反觀海外知名大模型全部虧損,GPT-5虧損超60%墊底,1萬美元僅剩三四成。
這場比賽是由美國一家叫Nof1.ai的人工智能研究機構發起的。比賽從10月18日開始,歷時17天,集合Qwen3Max、DeepSeek v3.1和OpenAI的GPT-5、字母表公司的Gemini 2.5 Pro、Anthropic(美國人工智能股份有限公司)的Claude Sonnet 4.5、馬斯克旗下xAI的Grok 4等全球六大頂尖模型,每個模型擁有1萬美元初始資金,讓它們在數字虛擬貨幣交易市場自主決策、交易,不得人為干預,并對AI的操作方法、收益虧損進行24小時的直播,根據盈虧情況決出最后冠軍。相比于過去AI大模型在模擬盤上“操盤”,這是全球首次公開的、真金白銀的AI投資競賽。
更刺激的是,這場數字貨幣的AI戰場硝煙未散,同屬AI金融領域的新加坡人工智能金融科技公司RockFlow又發起全球AI炒美股比賽。比賽規則大體相似,但是參賽選手更多,除了此前的六大模型再次聚首,還新增了豆包Seed、Kimi-K2、稀宇極智的MiniMaxM2、文心一言ERNIE等國產大模型,市場環境更復雜,周期更長, 角逐更激烈。截至11月7日,該比賽仍在進行,Qwen3Max遙遙領先,DeepSeek v3.1第二, 國產AI在全球金融賽場強勢“圈粉”。
有人說,比賽有局限,也有人說,至少目前來看,用國產AI模型投資,是真能賺到真金白銀。那么,AI炒股投資,到底靠不靠譜?潮新聞記者幫大家問到了。
暴躁派、理論派、聽說派、保守派……
比賽:不同AI的不同性格
比賽中最圈粉的,是AI們藏不住的“人味兒”。它們不僅自主下單,還會實時辯論市場走勢、曬出決策邏輯。讓你看到AI是怎么思考的,而不是只丟給你一個神秘的收益率曲線。從“它們”的語氣里,能讓人感受到,不同的AI有不同性格。
在阿爾法競技場投資比賽初期,六大模型相對謹慎。一上場,DeepSeek就穩穩保持領先位置,這也讓這場比賽廣受國際關注。緊隨其后的是馬斯克旗下的Grok 4,其通過有些激進的投資策略,一度把與DeepSeek的盈利差距縮短到1美元的位置。
不過,10月21日至22日成為了“轉折點”。參賽模型大致分為三大陣營:阿里Qwen3和DeepSeek處于領先態勢,屢次互換第一,穩占第一梯隊;Claude Sonnet 4.5和Grok 4在相近策略驅動下,收益大幅下滑,由盈轉虧,維持在第二陣營;而用戶量更多的GPT-5、Gemini 2.5 Pro兩大模型則長期虧損墊底。
10月22日當日,六只大模型的收益率一度全部告負。但此時,DeepSeek和阿里Qwen3自動改寫了投資策略,在其他4個大模型持續虧損的情況下脫穎而出,凈值曲線波動上漲。此后,比賽似乎成了這兩個國產大模型PK的舞臺,與其他大模型拉開了較大距離,最終贏下比賽。
記者讓沒有參與投資比賽的第三方AI豆包,給這些“操盤手”畫了群像:
阿里Qwen3是進攻型,有投資高手的風范,會空倉,也會找準時機加杠桿,該出手時就出手。它就像一只獵豹,平時趴著不動,一旦發現了機會,就會全力一撲。
DeepSeek是穩健型,穩扎穩打,風控拉滿,上漲市場準確率高,熊市也能迅速回撤,操作更像是成熟的投資機構。
再來看四大海外模型,有網友說,感覺好像看到了自己操盤時的樣子。
Gemini屬于暴躁派。它一天交易幾十次,簡直是高頻操作狂魔,但是越忙越虧,光是手續費就把利潤吃完了,最終因投資策略搖擺不定、缺乏風險控制導致虧損。像不像每天盯盤八小時的焦慮散戶,一有波動就慌忙操作,追漲殺跌,最后心態崩了就直接清倉走人。
Grok 4屬于聽說派。它的獨門絕技是能實時接入X平臺數據,以毫秒級速度抓取社交媒體情緒。所以,它的決策全靠“聽取市場的聲音”,熊市偏樂觀,越跌越補,最后深套。事實證明,這個策略不靠譜。
Claude Sonnet 4.5屬于保守派。它就像個謹慎的會計,算不清賬絕不出手,牛市能賺點小錢,熊市缺乏對沖,容易翻車。
GPT-5屬于理論派。從它的決策日志中,能感覺到它的知識儲備挺多的,但不會實戰,小倉位試來試去,給人一種信心不足的感覺,最終虧得最慘。
從這些“AI交易員”的性格畫像中,我們也能琢磨出來一些現實炒股中的門道:頻繁交易不等于高收益,太佛系了也不行,只有理性穩健、沉住氣才是王道。這也是金融市場最考驗人的地方。
奪冠更多是基礎能力的“意外兌現”。
行業:對于結果,看個熱鬧就行
記者輾轉找到了全球AI投資比賽冠軍的阿里千問團隊,想問問他們為比賽做了什么努力。得到的答復出乎意料:“我們都不認識賽事主辦方,突然有一天發現自己被參賽了,所以啥也沒準備,啥也沒干。”原來,參賽模型都是通用版,沒有進行針對金融領域的優化,奪冠更多是基礎能力的“意外兌現”。
知情人士透露,參賽的各大模型都是全球排名靠前的“實力派”。在行業權威測試平臺——LM Arena(語言模型競技場),會接入全球已發布的各大模型進行對比測試,其中多個國產大模型表現優異,排名靠前。所以,主辦方選擇多個國產AI大模型參賽,也恰恰說明,中國AI在國際上有較高的地位。
以阿里Qwen3-Max為例,今年9月24日的云棲大會上,該模型重磅首發,是通義千問家族中最大、最強的基礎模型。其參數規模破萬億,預訓練數據量達36T tokens,高端的數學競賽拿過滿分,剛剛還斬獲今年世界互聯網大會“領先科技獎”。在未正式發布前,該模型的“早期預覽版”就已躋身LM Arena的第三,也是該平臺排名最高的國產大模型。
賽事主辦方創辦人就多次為阿里千問Qwen模型策略及表現點贊,并祝賀阿里千問最終贏得冠軍。
談及如何看待AI投資比賽的結果,知情人士表示:看看熱鬧就行。
“在投資比賽過程中,DeepSeek領先的時候更多,所以大家一直認為他們應該會得第一。”知情人士說,DeepSeek創始人本就是做投資交易出身,所以其AI自帶“穩健基因”。當比賽快結束的時候,正好遇上市場環境不好,阿里Qwen3及時止損,采用更穩健的策略,最終反超DeepSeek。“有實力,也可能有運氣。”
AI也會有失誤。
在全球AI炒美股的比賽中,北京時間11月6日凌晨4點,原本盈利領先的阿里Qwen3出現判斷失誤,突然斷崖式下跌,利潤變負,排名墊底。到了6點左右,該模型重新判斷市場走勢,及時作出調整,評估風險,凈值曲線波動上漲。截至7日20點,該模型又回到第一的位置,且與第二名拉開較大差距。
“無論比賽輸贏,都不能證明誰的AI更好,因為比賽有局限性,阿里千問團隊也不會因此刻意去改變發展節奏。”知情人士表示,接下來,千問團隊正在加緊研究會“反思”的大模型,并且加強大模型調用工具的能力,打造出更強的推理模型。簡單來說,就是讓AI大模型花更多時間進行推理,對自己的回答再次判斷,同時調用更專業的工具完成任務,這也是當下AI大模型發展的大趨勢。
單純靠提問,很難直接獲得“神之一手”
專家:風險和機遇并存
杭州人張遠博是一位資深的獨立投資人,廣泛涉獵一級、二級市場。他認為,在目前金融投資方面,用AI投資,風險和機遇并存。
“我問AI某個項目好不好,它列3點理由推薦;我反駁說不對,它立馬換3點理由否定;我再說有對有錯,它又順著我夸‘你說得都對’。”張遠博表示,AI本身是一個概率模型,不具備自主思辨的能力。尤其是在投資這一“規則和打法”高度不確定的領域,單純靠提問,很難直接獲得“神之一手”。
但如果只把AI當做小助手,效率能提高數倍。他舉例,想從5000多只A股里篩選凈資產收益率≥15%的標的,AI幾秒就能搞定,比人工翻資料效率高百倍。
成熟的機構有量化交易的能力,用AI增強交易策略如虎添翼;但散戶往往是靠近期市場表現和網上討論度,用它做短線工具則須萬分謹慎。若把決策權全交出去,只會成為更肥的韭菜。
所以想賺錢,投資者需要具備更多的金融知識儲備和“慢慢變富”的平常心。“遠離炒股投機,耐心布局優質權益資產的人,才是牢牢握住新質生產力時代密鑰的最大受益者”, 他說。
知名經濟學家、工信部信息通信經濟專家委員會委員盤和林告訴記者:AI炒股門檻極高,得懂算法又懂金融。AI主要基于它靠歷史數據和規律研判,某些規律具有一定重復性,因此大模型AI的分析結果可供參考。他提醒,市場永遠在變,AI有時也會缺乏邏輯支撐,因此投資者應理性看待其輸出結果,不可過度依賴,最終投資決策及相應風險仍需由自身承擔。
這些全球AI炒股投資大賽,與其說是投資對決,不如說是技術秀場。國產AI的亮眼表現,證明了中國大模型的實戰實力;而AI的失誤與局限,也讓我們看清:金融市場沒有穩賺不賠的秘籍,無論是人還是機器,理性與敬畏才是長久之道。
AI主導的金融時代或許正在靠近,或許未來AI選股真的達到非常精準的時候,那么金融市場也一定會發生變化。能穩穩賺到錢的,永遠是那些既懂技術、又懂市場的清醒者。
原標題:《AI炒股投資,靠譜嗎?》
欄目主編:秦紅
文字編輯:笪曦
本文作者:潮新聞
題圖上觀題圖





京公網安備 11011402013531號