國產開源大模型DeepSeekV3爆火，低成本高效能引AI界贊嘆

IP屬地中國·北京 編輯：鐘景軒網界 時間：2025-01-01 12:00:11

在AI界，一款源自中國的開源大模型近期引發了國內外廣泛關注。這款名為DeepSeek-V3的模型，由新興AI企業DeepSeek研發推出，以其卓越性能和低廉的訓練成本，在業界掀起了波瀾。
DeepSeek-V3的技術論文詳細闡述了該模型的研發過程。論文指出，DeepSeek-V3的參數規模從前代的2360億提升至6710億，在14.8T tokens的數據集上進行了預訓練，上下文長度可達128K。評測結果顯示，DeepSeek-V3的性能已成為目前最強大的開源模型之一，且在多個主流評測基準上，其表現可媲美GPT-4o和Claude-3.5-Sonnet等領先的閉源模型。
除了安德烈，阿里前副總裁賈揚清、metaAI科學家田淵棟、英偉達高級研究科學家Jim Fan等多位AI領域的大牛，也對DeepSeek-V3表示了贊賞。有網友甚至認為，這是“全球最佳開源大模型”，并預測這將推動AGI（通用人工智能）的實現比預期更早且成本更低。
DeepSeek-V3之所以能引起AI大牛的關注，很大程度上是因為其低廉的訓練成本。據悉，該模型僅用了2000多張GPU，訓練成本不到600萬美元，遠低于OpenAI、meta等在萬卡規模上訓練的模型成本。這一成本效益比，讓DeepSeek-V3在業界脫穎而出。
在知識能力方面，DeepSeek-V3在MMLU-Pro和GPQA-Diamond等基準測試中超越了阿里、meta等所有開源模型，并領先GPT-4o，但略遜于Claude-3.5-Sonnet。而在數學、代碼和推理能力方面，DeepSeek-V3在MATH500、AIME2024及Codeforces等多個主流基準測試中，不僅碾壓了阿里和meta的最新開源模型，還超越了GPT-4o和Claude-3.5-Sonnet。
不過，值得注意的是，DeepSeek-V3在某些方面還存在局限性。例如，其英文能力還落后于GPT-4o和Claude-Sonnet-3.5，同時部署要求較高，對小型團隊不太友好，且生成速度還有提升潛力。但DeepSeek在論文中表示，隨著更先進硬件的開發，這些局限性有望得到解決。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

TikTok簽署協議，將美國業務出售給甲骨文等主導的合資企業

谷歌安卓16調整Emoji表情設計，風格向iOS靠攏

周受資內部信曝TikTok美國方案；騰訊辟謠元寶由真人運營丨邦早報

TikTok美國業務新進展：字節保留電商、廣告等，引入三方組新合資公司負責數據安全

AI浪潮下，10年后的頂尖高校拼什么？丨GAIR 2025

極數迭代CEO佟顯喬：具身智能的數據工程解決方案思考丨GAIR 2025

全站最新

TikTok簽署協議，將美國業務出售給甲骨文等主導的合資企業

谷歌安卓16調整Emoji表情設計，風格向iOS靠攏

周受資內部信曝TikTok美國方案；騰訊辟謠元寶由真人運營丨邦早報

TikTok美國業務新進展：字節保留電商、廣告等，引入三方組新合資公司負責數據安全

熱門推薦

授權亂象頻出，誰的同仁堂？

當“野性消費”退潮：鴻星爾克留下了什么？

英氏控股的優勢只有品牌和廣告嗎？

為什么蘋果、華為，都干不過小天才？

豪擲10億美金投資OpenAI！迪士尼終于對AI妥協了？（深度觀察）

從“寧王”到“易中天”，時代的“魚群”在遷徙

阿維塔赴港IPO：一場針對“依附者”的價值審視

“鐵飯碗”銀行也開始末位淘汰了？普通人有機會，但沒退路

君樂寶，想要逃出伊利、蒙牛的“五指山”

5 個月估值翻 3 倍！瑞典 AI 巨頭 Lovable 獲 3.3 億美元 B 輪融資

十億流量瞬間清零!YouTube 永久封禁兩大 AI 虛假預告片“鼻祖”頻道

OpenAI 更新 ChatGPT 以強化未成年人保護措施

告別信息淹沒！ChatGPT 推出聊天置頂功能，讓重要對話觸手可及

Meta 官宣2026上半年發布 Mango 系列下一代模型

ChatGPT 移動應用全球用戶支出突破 30 億美元