5 道高考題訊飛星火 X1 升級版和 DeepSeek 誰才是當仁不讓的數學狀元

IP屬地中國·北京 編輯：趙云飛砍柴網 時間：2025-03-07 23:05:21

3月3日，科大訊飛完成星火深度推理模型X1的全面升級，并基于星火X1首發星火醫療大模型X1，在診斷推薦、健康咨詢等醫學任務上效果領先。
作為國內首個，也是迄今為止唯一一個采用全國產算力訓練的深度推理大模型，星火X1在模型參數量較少的情況下，實現了數學能力與DeepSeek R1和OpenAI o1對標；訊飛星火X1的升級，表明基于國產算力訓練的全棧自主可控大模型具備強大實力和創新潛力。
測試集合中文測試集來自2023/2024年各學段考試真題/模擬題/競賽題，英文測試集來自AIME 2024/2025和MATH 500競賽集
我們在星火X1升級后的第一時間，將其數學能力和DeepSeek做了簡單對比，用的5道測試題含金量頗高，全部來自《2024年全國統一高考數學試卷(新高考Ⅰ)》，兩大模型答卷情況如下：
小提示：由于高考試題較難，大模型給出的解題過程往往很長，用截圖的方法很難一次截取完整，需要兩次，因此下面給出的同一問題的解答截圖。
題目1：
甲、乙兩人各有四張卡片，每張卡片上標有一個數字，甲的卡片上分別標有數字1，3，5，7，乙的卡片上分別標有數字2，4，6，8，兩人進行四輪比賽，在每輪比賽中，兩人各自從自己持有的卡片中隨機選一張，并比較所選卡片上數字的大小，數字大的人得1分，數字小的人得0分，然后各自棄置此輪所選的卡片（棄置的卡片在此后輪次中不能使用）．則四輪比賽后，甲的總得分不小于2的概率是多少？
星火X1解答如下：
DeepSeek R1解答如下：
星火XI開門紅，先勝一局，給出了正確答案，且解題過程相當清楚。DeepSeek大意失荊州，給出了錯誤答案。
題目2：
星火X1解答如下：
DeepSeek R1解答如下：
這局表現整體不錯，兩款大模型都給出的正確答案，看來DeepSeek終于睡醒了，老虎要發威了。
題目3：
星火X1解答如下：
DeepSeek解答如下：
兩大模型再接再厲，并駕齊驅，再度拿下一城。
題目4：
星火X1解答如下：
DeepSeek R1解答如下：
這是一道典型的差數列問題，兩大模型均給出了準確答案，表揚！
題目5：
星火X1解答如下：
DeepSeek解答如下：
星火X1解答正確，DeepSeek剛展現出來的猛勁似乎又過了，在一道看起來并不很難的題上栽了跟頭，錯失一城。
小結：
至此，筆者興致勃勃舉辦的這場友誼賽暫告結束，從整場賽事的表現來看，兩款大模型在解答問題前，都會進行類人思考，并將思考過程完整呈現出來，其中包括題意分析，解題過程中要用到的知識點及詳細的推理邏輯等，并會在發現問題時及時反思、糾錯，應該說這一功能相當有用。因為它會讓用戶在得到答案的同時，知其然，更知其所以然，從而舉一反三，弄懂一大類題的解法。
此外支持識圖解題，而且識別率超高，無論是手機拍的紙質試卷、作業，還是網上的截圖，都能輕松識別并解答。兩大模型的這一特點，很好地解決數學公式、圖形難以用鍵盤輸入的痛點。
只是在解題正確率方面，兩大模型表現出一定差異，相比之下，星火X1的正確率要更高一些，5題全對，成為本次“摸底考試”的“尖子生”，DeepSeek則失誤了兩題，以一道題20分，滿分100來算，此次比賽剛好及格。
訊飛星火深度推理大模型X1升級版之所以有這樣的表現，或許與其此次新增的兩大創新技術有關。
這兩大技術一是通過高效的領域數據自動化挖掘和多類型數據合成算法，構建了海量的數學領域預訓練數據，從而顯著提升了基座模型的數學專業能力；
二是基于評語模型與強化學習算法，實現了大模型長思維鏈的激發，同時評語模型還促使大模型在推理過程中進行反思驗證，進一步提升了模型在推理階段的準確性。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

人工智能公司MiniMax通過港交所聆訊

開悟世界模型3.0發布，讓機器人“理解”物理世界規律并“預測”未來

不懂AI，晉升空間有限？中國人才勢能大會，兩類人才被密切關注

從網線到人生攻擊？項立剛批羅永浩 “干啥啥不成”，網友吵翻了

Intel顯卡沖擊高端：竟然要直接上32GB顯存！

一個人就是一支隊伍！上海首個人工智能廣告“一人公司”誕生！

全站最新

人工智能公司MiniMax通過港交所聆訊

開悟世界模型3.0發布，讓機器人“理解”物理世界規律并“預測”未來

不懂AI，晉升空間有限？中國人才勢能大會，兩類人才被密切關注

從網線到人生攻擊？項立剛批羅永浩 “干啥啥不成”，網友吵翻了

熱門推薦

人工智能公司MiniMax通過港交所聆訊

開悟世界模型3.0發布，讓機器人“理解”物理世界規律并“預測”未來

【西街觀察】硬科技上市驗“真金”

不懂AI，晉升空間有限？中國人才勢能大會，兩類人才被密切關注

從網線到人生攻擊？項立剛批羅永浩 “干啥啥不成”，網友吵翻了

Intel顯卡沖擊高端：竟然要直接上32GB顯存！

一個人就是一支隊伍！上海首個人工智能廣告“一人公司”誕生！

電子產品信息清除強制國標發布二手流通加上“安全鎖”

杭州外骨骼，斬獲大獎！

月入過萬、15天躺賺264萬……專坑你爸媽！

從中試孵化邁向產業化，固態動力電池技術成果在鹽城發布

又一家國產GPU企業，沖刺港股IPO！

手機套餐套路深：升易降難、區別對待，消費者如何應對？

MiniMax通過上市聆訊：持有現金超10億美元阿里米哈游騰訊加持

上海速度！成立不足四年，平均年齡29歲的AI公司，閃電沖擊港股上市

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

首頁

新科技

新金融

新零售

智能車

房地產

科技探索

人物資訊

網絡游戲

人工智能

5 道高考題訊飛星火 X1 升級版和 DeepSeek 誰才是當仁不讓的數學狀元

首頁

資訊

財經號

智能車

專題

電商資訊

人物資訊

滾動資訊

5 道高考題 訊飛星火 X1 升級版和 DeepSeek 誰才是當仁不讓的數學狀元

同類資訊

5 道高考題訊飛星火 X1 升級版和 DeepSeek 誰才是當仁不讓的數學狀元