近日,搭載英偉達 GB10 Grace Blackwell 超級芯片的 DGX Spark 桌面 AI 超算產品陸續上市開售,作為英偉達首款面向輕量化場景的 Grace Blackwell 架構產品,DGX Spark 不是單純的性能堆疊,而是面向高性能工作站、桌面級 AI 開發和輕量化數據中心的整體解決方案,試圖以“迷你機身 + 大模型支持”的組合,填補消費級顯卡與大型數據中心之間的算力空白。
從今年初 NVIDIA 首次宣布代號 Project DIGITS,到第一方 FE 版本定價 3999 美元(約合 28533 元人民幣),當時一度憑借 NUC 級的小巧體積與 1PetaFlop(1000TOPS)的 FP4 稀疏 AI 算力,點燃了桌面級高性能 AI 計算市場的討論熱情。現在,被重新命名為 DGX Spark 的桌面迷你 AI 工作站終于正式開售,華碩、戴爾和聯想等上市的產品價格基本都在 32999 元以上。
隨著 DGX Spark 的開售,讓IT之家不禁想起另一款在相同賽道上已經站穩腳跟的產品 —— 基于 AMD 銳龍 AI Max+ 395 處理器的 Mini AI 工作站。同樣主打“桌面級 AI 算力”,同樣支持大模型本地推理,英偉達 GB10 與 AMD 銳龍 AI Max+ 395 究竟在架構設計、性能表現上有何差異?對于缺乏專業機房支持、預算有限且需要兼顧多場景使用的入門開發者而言,哪款產品更能滿足“低門檻、高實用”的核心需求?今天不妨隨小編來分析一下。
![]()
架構與性能對比:從芯片設計到實際算力的差異化呈現
要判斷兩款產品的適用場景,首先需深入其核心芯片的架構邏輯與實際性能表現。英偉達 GB10 與 AMD 銳龍 AI Max+ 395 雖同為“高性能計算芯片”,但在核心定位、架構設計與性能釋放上,呈現出鮮明的差異化特征,而這些差異直接決定了它們對入門開發者的友好度。
英偉達 GB10:數據中心技術的桌面化應用
英偉達 GB10 超級芯片是其旗艦級 Grace-Blackwell 超級芯片的“小型化集成版本”,其設計目標是在有限的物理空間和功耗下(整機功耗約 240 瓦),承擔起此前必須依賴大型數據中心系統的部分任務。
計算核心:GB10 的 CPU 部分是英偉達與聯發科合作的產物,采用了 20 核 ARMv9.2 架構,具體由 10 個高性能 Arm Cortex-X925 核心與 10 個高能效 Arm Cortex-A725 核心組成。其 GPU 單元則擁有 6144 個 CUDA 核心,是 Blackwell 架構的精簡版本。該 GPU 保留了對 FP4(4 位浮點)數據格式的支持,使其能夠實現 1 PetaFLOP(即 1000 TOPS)的稀疏 AI 算力。在單精度(FP32)性能方面,其算力為 31 TFLOPS,與消費級顯卡 RTX 5070 的水平相當。
![]()
統一內存與高速互聯:該芯片配置了 128GB、256 位的 LPDDR5x-9400 統一內存,通過 2.5D 封裝技術與 CPU、GPU 集成。CPU 與 GPU 通過帶寬高達 600 GB/s 的 NVlink C2C(Chip-to-Chip)鏈路共享內存池,旨在減少傳統 PCIe 總線帶來的數據傳輸延遲。
專用網絡與擴展功能:DGX Spark 集成了 ConnectX-7 200Gb/s 高速網卡。通過背部的 QSFP 端口,用戶可以連接兩臺 DGX Spark 設備,從而將推理能力擴展至支持高達 4050 億參數的模型。這進一步明確了其作為專業 AI 開發工具的定位。
軟件生態:搭載定制版 DGX OS(基于 Ubuntu Linux),預裝英偉達 AI 軟件堆棧,僅支持 Linux 環境下的 AI 開發,不兼容 Windows 系統與 X86 架構軟件。
AMD 銳龍 AI Max+ 395:端側 AI 的“全場景全能選手”
與 GB10 的“單一場景優化”不同,AMD 銳龍 AI Max+ 395 的核心設計邏輯是“兼顧 AI 算力與全場景兼容性”,其架構圍繞“Zen5 CPU+RDNA3.5 GPU+XDNA2 NPU”的三重計算單元展開,參數配置更貼近入門開發者的多維度需求:
計算核心:16 核 32 線程的 Zen 5 架構 CPU,最高加速頻率高達 5.1GHz,配備 80MB 總緩存(16MB L2+64MB L3),性能接近桌面級處理器,可輕松應對數據預處理、多任務并發等需求;最高 40 單元的 RDNA 3.5 架構 iGPU(命名為 Radeon 8060S),帶寬達 256GB/s,性能媲美移動版 RTX 4060/4070,支持圖形密集型 AI 任務(如多模態模型推理);XDNA 2 NPU 峰值算力高達 50TOPS,原生支持微軟 Windows 11 AI+PC 規范與 Copilot 等端側 AI 應用。
![]()
內存架構:采用 AMD 獨創的 UMA(Unified Memory Architecture)統一內存技術,最高支持 128GB 內存,其中最高 96GB 可專屬分配給 GPU 作為專屬顯存,并再將 16GB 作為共享顯存。這種動態調度機制無需頻繁進行內存復制,徹底消除了傳統“CPU 內存 + GPU 顯存”分離架構的“數據搬運開銷”,對大模型加載與推理效率的提升尤為明顯。
軟件生態:基于 X86 架構,默認支持 Windows 系統,可無縫兼容 Office、Photoshop 等日常軟件,以及 TensorFlow、PyTorch 等主流 AI 開發框架,其開源 AI 軟件框架 ROCm 近期也宣布對于 Windows 的支持。同時,AMD 銳龍 AI MAX+ 395 也原生適配 Ubuntu 系統,相信 AMD 395 更兼顧傳統開發與 AI 創新需求。
![]()
那么,兩大芯片在面對 AI 大模型本地運行時的實際性能表現如何呢?就在 10 月 16 日,第三方 YouTube 博主 Bijan Bowen 對 DGX Spark 和銳龍 AI Max+ 395 平臺進行了性能對比實測,這里IT之家不妨引用一下他的實測數據,來給大家做一個參考:
![]()
整體來看,在四個不同量級和類型的模型測試中,雙方雖各有勝負,但 AMD 的表現整體上竟然還要稍微領先一些。以 Llama 3.3 70B 的測試為例,推理運行需要激活大量參數的稠密模型場景,AMD 以 4.9 tok / sec 的速度領先于英偉達的 4.67 tok / sec。這說明盡管英偉達擁有 CUDA 生態和更高的 FP4 算力,受限于帶寬,在實際的 Tokens 生成速度表現上,AMD 的 Strix Halo 完全有能力正面抗衡。
在 4 個測試中的 3 個,AMD 平臺都取得了更快的“首 token 生成時間”(time to first token),這意味著在交互式 AI 應用(如編碼助手、聊天機器人)中,用戶能更快地得到響應,體驗可能更流暢。
綜合來看,在入門開發者高頻使用的中大型模型,尤其是 MoE 架構模型(Qwen3-30B-A3B、GPT-OSS 20B)上,AMD 銳龍 AI Max+ 395 的生成速度(435.13 tok / sec、64.69 tok / sec)均和英偉達 GB10(38.03 tok / sec、60.33 tok / sec)勢均力敵,且首 token 響應時間除 Llama 3.3 70B 外均更短 —— 這意味著在實際開發中,AMD 平臺能更快響應,減少開發者的等待時間。
因此整體來看,AMD 的性能表現更貼合入門群體的實際使用場景。
從生態到成本面面觀,AMD 銳龍 AI Max+ 395 具有“入門友好型”優勢
對于入門開發者而言,硬件性能僅是選擇標準之一,生態兼容性、產品普及度與單位成本效益等等,也是非常關鍵的決策因素。那么從這些要素的層面來看,英偉達 GB10 與 AMD 銳龍 AI Max+395 相比究竟誰更有優勢呢?下面我們繼續來看。
生態兼容性:X86 / Windows 架構,無需妥協非 AI 需求
英偉達 DGX Spark 運行的是定制版 Ubuntu Linux。對于那些常年沉浸在 Linux 環境中的資深 AI 研究者來說,這或許如魚得水。但對于絕大多數初創中小團隊、入門開發者、學生或從其他領域(如 Web 開發、應用開發)轉型而來的工程師而言,這反而成了一個比較高的門檻。他們的日常工作流 —— 無論是使用 Visual Studio、JetBrains 全家桶,還是 Adobe 創意套件,亦或是簡單的 Office 辦公,都深度綁定在 Windows 生態上。
畢竟,入門開發者的工作場景往往并非“純 AI 開發”,多數人還需要兼顧日常辦公、文檔處理、傳統編程甚至輕度設計任務,而這恰恰是 AMD 銳龍 AI Max+ 395 的核心優勢所在 —— 基于 X86 架構與 Windows 系統,其生態成熟度遠超英偉達 GB10 的 Arm / Linux 組合。
具體來看,AMD 銳龍平臺可直接運行 Office、微信、瀏覽器等日常軟件,無需額外配置;在開發工具層面,Visual Studio、PyCharm 等主流 IDE 均對 Windows 有完善支持,TensorFlow、PyTorch 等 AI 框架也已實現 Windows 環境的“一鍵安裝”,新手無需花費大量時間學習 Linux 命令與環境配置。此外,AMD 還支持 WSL 子系統,若開發者需要使用 Linux 專屬工具(如某些開源模型的編譯環境),可在 Windows 系統內直接開啟 Linux 終端,避免了“雙系統切換”的繁瑣。
總之,Windows 系統的普及度更高,生態健全性是天生優勢。入門開發者不需要在‘AI 開發’與‘日常使用’之間做妥協,這正是 AMD 平臺的核心價值之一。
終端產品普及度與市場成熟度
英偉達的 DGX Spark 及其合作伙伴產品,在 2025 年 10 月 15 日才剛剛“正式發售”。作為一個全新的平臺(Arm+Linux 的桌面 AI 設備),其早期的市場表現、驅動程序穩定性、軟件兼容性仍有待觀察。
相比之下,搭載 AMD 銳龍 AI Max+ 395 的 Mini AI 工作站正處于一個“爆發”狀態。截至 2025 年 10 月,搭載 AMD 銳龍 AI Max+ 395 的 Mini AI 工作站已有數十款產品正在熱銷,有不同的配置和價格區間,可滿足不同預算的需求:
比如像希未 SEAVIV AideaStation R1、極摩客 GMKtec EVO-X2、零刻 Beelink GTR9 Pro、銘凡 MINIS FORUM MS-S1 MAX 等都提供了從 64GB 內存 + 1TB SSD 萬元左右的配置(可支持 700 億參數模型推理,適合預算有限的個人開發者),到 128GB 內存 + 2TB SSD 這種 15000 元左右的價位檔的配置(支持 2000 億參數模型本地部署,適合中小團隊)。
![]()
再往上還有惠普 HP Z2 Mini G1a(21999 元),具備更穩定的散熱設計與企業級售后,適合對可靠性要求較高的場景。總之開發者們可以有豐富的選擇。
這些產品已在京東、天貓等電商平臺正式開售,用戶可直接購買并“開箱即用”,部分品牌還提供“預裝 LM Studio、Gaia 等 AI 工具”的增值服務,進一步降低入門難度。這些產品早已在市場上銷售數月,經過了早期用戶的檢驗,形成了成熟的產品矩陣和消費者認知。
對于一個急于上手的開發者來說,AMD 方案提供了“開箱即用”的便利性和豐富的選擇:從 9999 元的入門款到 21999 元的品牌工作站,從風冷到水冷,從緊湊型到可擴展型,豐儉由人。這種先發優勢和市場成熟度,顯然意味著更低的購買風險、更完善的社區支持和即時的生產力。
單位成本效益:AMD 每萬元算力更高,性價比突出
對于入門開發者而言,“單位價格對應的推理性能”是衡量性價比的核心指標。結合上面我們引用的第三方測試數據與終端產品價格,我們可以清晰看到 AMD 銳龍 AI Max+395 的成本優勢:
以 GPT-OSS 20B 模型(入門開發者常用的中大型模型)為例,在該博主測試中使用的 AMD 陣營的極摩客 GMKtec EVO-X2(14999 元)生成速度為 64.69 tok / sec,折算后“每萬元對應的生成速度”約為 43.13 tok / sec;而英偉達 DGX Spark FE 版(28533 元)的生成速度為 60.33 tok / sec,“每萬元對應的生成速度”僅為 21.14 tok / sec—— 也就是說,在相同預算下,AMD 平臺能提供兩倍以上的推理性能。如果以已經上市后的產品價格算,英偉達 DGX Spark 當前在電商平臺的價格都在 32999 元以上,“每萬元對應的生成速度”更是只有 18.28 tok / sec,而 AMD 平臺能提供近 2.4 倍的推理性能。
![]()
此外,AMD 平臺的“長期使用成本”也更低:Windows 系統下的軟件多為免費或低價(如 Office 365 個人版年費僅 398 元),而 Linux 系統的部分專業工具(如某些商業 AI 優化軟件)需單獨付費;AMD 的生態伙伴 Ripple AI 還提供“遠程測試平臺”,開發者無需購買硬件即可體驗算力,進一步降低了試錯成本。
其他方面考量
除生態與成本外,我們也可以關注一下開發者們同樣關注的“模型適配速度”、“硬件擴展能力”等這些問題上,目前 DGX Spark 桌面超算和搭載銳龍 AI Max+ 395 處理器的桌面 Mini AI 工作站的差別。
模型適配:AMD AI 團隊通過前期的緊密協作,對主流模型實現“當天適配”—— 例如 GPT-OSS-120B 模型發布當天,AMD 平臺即完成適配;對于 AI 初創企業的爆款模型,也能實現“零日響應”,確保開發者能及時體驗最新模型。而英偉達 GB10 的模型適配信息尚未公開,僅提及“預裝 AI 軟件堆棧”,靈活性不足。
硬件擴展靈活:AMD 支持通過 USB4 接口實現多機串聯,六聯智能最近在中國國際信息通信展覽會上做了一個六機并聯的演示,專屬顯存可擴展至 576GB,滿足更大規模模型(如 4000 億參數)的推理需求;而英偉達 DGX Spark 僅支持通過 ConnectX-7 網卡實現雙機互聯,擴展方式單一且成本更高(僅單塊 ConnectX-7 網卡價格又得 1W+)。
入門支持完善:AMD 聯合 RIPPLE AI 打造了“AI 開發者支持平臺”,提供“開箱即用”的開發環境(預裝模型、工具鏈)、線上教程與社區論壇,新手可快速上手;還針對學生群體推出“高校支持計劃”,提供硬件試用與課程合作,進一步降低學習門檻。
結語
總體來說,通過對架構、性能、生態和成本等各方面的分析,我們可以看出英偉達 DGX Spark 和基于 AMD 銳龍 AI Max+ 395 的迷你工作站是面向不同用戶群體的解決方案。
英偉達 DGX Spark 憑借其專用的硬件設計和與 CUDA 生態的深度整合,為專業 AI 研究人員和深度綁定于英偉達生態系統的開發者提供了一個高性能的桌面工具。其較高的價格和特定的 ARM / Linux 操作系統環境,也決定了它的用戶群體相對聚焦。
而 AMD 銳龍 AI Max+ 395 平臺則提供了一個更為通用的解決方案。它的主要優勢體現在以下幾個方面:
平臺通用性:基于成熟的 x86 / Windows 生態,既能作為一臺高性能的通用工作站,也能滿足大型 AI 模型的本地推理需求,兼顧了日常工作與開發的雙重需要。
市場成熟度:市場上已有多個品牌提供相關產品,消費者擁有更豐富的選擇空間。
成本效益:在關鍵的“單位價格推理性能”指標上具有明顯優勢,顯著降低了本地部署 AI 大模型的硬件門檻。
開放生態:依托用戶基數龐大的 Windows 平臺,并通過與社區合作、舉辦開發者競賽等方式,AMD 正在構建一個開放的開發者生態系統。
![]()
隨著 AI 開發逐漸從“專業領域”走向“大眾市場”,像 AMD 銳龍 AI Max+ 395 這樣的“普惠型”產品,正成為推動 AI 平權的關鍵力量。對于想要踏入 AI 開發領域、卻受限于預算與技術門檻的開發者而言,基于 AMD 銳龍 AI Max+ 395 的 Mini AI 工作站,無疑是當前階段的最優選擇 —— 它不需要你是 Linux 專家,不需要你有巨額預算,只需要你有創新想法,就能在桌面端開啟屬于自己的 AI 開發之旅。





京公網安備 11011402013531號