當 AI 巨頭們爭相投入數十億乃至上百億美元建設數據中心、采購更多 GPU 來訓練和運行大型模型時,一家名為 Extropic 的初創公司正在嘗試一條截然不同的道路。這家成立于 2022 年的公司剛剛推出了首個工作硬件原型,它的核心技術不依賴傳統的 0 和 1 比特,而是通過“概率比特”來處理信息,這種獨特的方法,可能會從根本上改變 AI 計算的能效方程式。
10 月 29 日,Extropic 宣布其首個硬件 XTR-0 已交付給包括前沿 AI 實驗室、氣象建模初創公司以及多國政府代表在內的合作伙伴進行測試。
![]()
(Extropic)
讓噪聲成為計算的燃料
Extropic 將其處理器稱為“熱力學采樣單元”(Thermodynamic Sampling Unit,TSU),以區別于傳統的中央處理器(CPU,Central Processing Unit)或圖形處理器(GPU,Graphics Processing Unit)。
傳統計算機竭力消除電路中的熱噪聲和電子波動,Extropic 卻反其道而行之,將這些通常被視為敵人的物理現象轉化為寶貴的計算資源。他們設計的處理器 TSU 的基本構成單位不再是確定的比特(bit),而是“概率比特”(probabilistic bit,p-bit)。
傳統的比特在任何時刻都只有兩個明確的狀態:0 或 1。而 p-bit 則利用晶體管內在的熱噪聲,使其在 0 和 1 之間自然地、概率性地波動。這種設計使得 TSU 能夠原生、高效地執行概率算法,尤其是生成式 AI 模型中常見的采樣任務。
![]()
(Extropic)
目前主流的 AI 模型,如大語言模型和擴散模型,其核心環節之一就是從一個復雜的概率分布中抽取樣本。在目前的 GPU 架構上,這一過程通常需要大量的矩陣運算來首先計算出概率分布,然后再進行采樣,整個過程不僅計算密集,而且能耗巨大。Extropic 的 TSU 則跳過了復雜的矩陣運算,直接通過物理過程對概率分布進行建模和采樣。
![]()
圖丨相關論文(arXiv)
根據 Extropic 于 2025 年 10 月 28 日在學術預印本網站 arXiv 上發布的論文《一種用于類擴散模型的高效概率硬件架構》(An efficient probabilistic hardware architecture for diffusion-like models),其設計的全晶體管概率計算機,在運行他們提出的“去噪熱力學模型”(Denoising Thermodynamic Model,DTM)時,相較于在 GPU 上運行的同類算法,能在達到同等性能水平(performance parity)的前提下,將能耗降低約 10,000 倍。
從量子計算的“科學出走”到熱力學計算
Extropic 的故事,某種程度上源于對量子計算前景的失望。創始人 Guillaume Verdon 和 Trevor McCourt 都曾是 Google 量子計算團隊的核心成員,兩人在滑鐵盧大學參與創建 TensorFlow Quantum 項目時相識。
![]()
圖丨Guillaume Verdon(左)與 Trever McCourt(右)(X)
Verdon 是量子深度學習領域的先驅人物,在滑鐵盧大學攻讀應用數學與量子信息博士學位期間,他創立了后來成為 Google TensorFlow Quantum 的項目,之后加入了 Google Quantum AI 團隊。在 Alphabet 旗下的登月工廠 X,他擔任物理與 AI 團隊的量子技術負責人,推動了一系列從感知、通信到表征學習的量子技術應用。
McCourt 最初是一名機械工程師,在滑鐵盧大學加入 TensorFlow Quantum 項目的創始團隊后,開始與 Verdon 密切合作,共同開創了可微分量子編程軟件。之后他轉向硬件工程方向,在 Google Quantum AI 開發尖端設備和控制技術。但量子計算的可擴展性時間線不斷延長,讓這些技術精英開始尋找新的出路。McCourt 隨后前往麻省理工學院攻讀博士,專注研究噪聲在計算和生命系統中的作用——這一研究方向,也成為 Extropic 核心理念的基礎。
2022 年,Guillaume Verdon 和 Trevor McCourt 離開了量子計算領域,創立了 Extropic。按照公司的說法,團隊中的許多成員都經歷了“量子計算的科學出走”(scientific exodus from quantum computing)。隨著量子物理計算機的可擴展性時間表一再拉長,這些物理學家和工程師開始尋求另一條通往實用物理計算的道路:一條不依賴量子力學、將噪聲視為可利用的資源而非負擔、不需要器件物理學奇跡就能達到工業規模的道路。
公司的首席架構師 Christopher Chamberland 曾在 AWS 和 IBM 量子部門領導核心架構和路線圖制定工作,被廣泛認為是最杰出的量子計算機架構師之一,但他最終也選擇離開量子計算領域,加入 Extropic。這支團隊的成員此前來自谷歌 AI、AWS、meta、IBM、英偉達等公司,他們試圖在物理學與 AI 的交叉點上開辟新的可能性。
2023 年 12 月,Extropic 宣布完成 1,410 萬美元的種子輪融資,由 Kindred Ventures 領投,投資者名單中包括 Perplexity 的 Aravind Srinivas、Y Combinator 的 Garry Tan、Naval Ravikant 和 Shopify 的 Tobias Lütke 等知名天使投資人。
從原型到下一代芯片
近日,他們已經推出了首款硬件原型 XTR-0。目前發布的 XTR-0 硬件由一個現場可編程門陣列(FPGA,Field-Programmable Gate Array)芯片與兩個 X-0 芯片組成,后者各包含少量 p-bit。盡管規模有限,但這一原型已經證明了公司方法的潛力。Extropic 已經將第一代芯片交付給了包括前沿 AI 實驗室、氣象建模初創公司以及多國政府機構在內的早期合作伙伴。
![]()
圖丨首款硬件原型 XTR-0(Extropic)
氣象 AI 公司 Atmo 的 CEO Johan Mathe 是首批測試者之一,該公司使用 AI 模型進行高分辨率天氣預報,客戶包括美國國防部。Mathe 表示,Extropic 的芯片將使更高效地計算不同天氣條件的概率成為可能。他已經使用了公司發布的軟件庫以及真實芯片進行測試,“我能夠運行幾個 p-bit,看到它們按預期方式運行。”
這個軟件庫名為 THRML,是 Extropic 同步發布的重要工具。它使開發者能夠在 GPU 上模擬 TSU 芯片的行為,從而在真正的硬件到來之前就能開發熱力學機器學習算法。這種策略也類似于英偉達當年通過 CUDA 軟件生態系統建立競爭優勢的做法,即先讓開發者熟悉新的編程范式,再推動硬件的大規模部署。
公司計劃于 2026 年發布的下一代芯片 Z-1 預計將包含 25 萬個 p-bit。在最近發布的論文中,他們還詳細闡述了如何利用 Z-1 芯片來創建一種新型擴散模型。
傳統的基于能量的模型(Energy-based Models,EBMs)在概率計算中面臨一個根本性難題,Extropic 將其稱為“混合-表達性權衡”(Mixing-Expressivity Tradeoff,MET)。簡單來說,當模型的表達能力增強時,從該模型中抽取獨立樣本所需的計算量會急劇增加,導致推理成本高昂且訓練不穩定。這就像試圖在一個布滿高墻的能量景觀中移動,兩個“山谷”之間的巨大勢壘會讓迭代采樣器陷入停滯。
Extropic 提出的解決方案是去噪熱力學模型。這種模型將 EBMs 與擴散模型相結合,不是試圖用單一的 EBM 來建模數據分布,而是通過一系列 EBMs 逐步構建復雜性。每一步的能量景觀都保持相對簡單且易于采樣,但整個鏈條能夠表達的分布復雜度卻不受限制。這種漸進式的復雜性構建允許模型在固定計算預算下表達更復雜的分布,從而規避了 MET 的限制。
實際操作中,DTMs 通過學習一系列條件分布來逆轉一個將數據分布逐漸轉化為簡單噪聲的過程,進而用于生成新數據。關鍵在于為給定問題選擇適當的步數,使得逆向過程的分布既足夠復雜以獲得良好性能,又不會復雜到難以采樣。
根據論文中的數據,Extropic 團隊開發的 DTM 架構在簡單圖像生成基準測試上已經顯示出驚人的能效。他們使用一個僅包含 70×70 采樣單元的網格,成功生成了來自 Fashion-MNIST 數據集的低分辨率灰度服裝圖像。論文中的對比圖顯示,在相同的性能水平下,DTM 在 TSU 上的能耗比在 GPU 上運行的傳統方法低約一萬倍。
![]()
(Extropic)
一種可能的計算未來
不過,硬件原型的誕生還只是其邁向大規模生產和應用的一小步,從數十個 p-bits 擴展到百萬甚至數十億級別,技術難度會呈指數級增長。芯片制造的良率、系統集成的復雜性、軟件生態的建立,每一個環節都可能成為瓶頸。正如 Extropic 首席技術官 McCourt 所坦言:“我們擁有一個比矩陣乘法更高效的機器學習原語,但問題是,如何構建出像 ChatGPT 或 Midjourney 那樣規模的東西。”
當前,美國企業每年在 AI 數據中心上的投入已經超過了阿波羅登月計劃經通脹調整后的總成本。到 2030 年,這些數據中心可能消耗美國 10% 的電力。在這樣的背景下,任何能夠顯著提高能效的技術都具有重要意義。如果 Extropic 聲稱的 1 萬倍能效提升能夠在實際應用中兌現哪怕一部分,也足以引起關注。
分布式 AI 初創公司 Prime Intellect 的首席執行官 Vincent Weisser 認為:“他們對信息處理物理學的方法,可能在未來十年帶來變革性影響,特別是當傳統晶體管縮放觸及基本極限時。”不過他也指出,“如果能夠實際擴展”仍是關鍵前提。
現實肯定比一套簡單的“顛覆”敘事要更為復雜。Extropic 的技術可能無法全面取代傳統 GPU,但可以在某些特定應用場景中提供補充。概率計算天然適合生成式模型的采樣、不確定性量化、貝葉斯推理等任務,但對于需要精確數值計算的場景,傳統硬件可能仍然不可替代。就像量子計算被期待在特定問題上展現“量子優勢”而非全面替代經典計算一樣,熱力學計算可能也會找到屬于自己的生態位。
參考資料:
1.https://extropic.ai/writing/inside-x0-and-xtr-0
2.https://extropic.ai/writing/tsu-101-an-entirely-new-type-of-computing-hardware
3.https://extropic.ai/writing/thermodynamic-computing-from-zero-to-one
4.https://arxiv.org/abs/2510.23972
5.https://www.wired.com/story/extropic-aims-to-disrupt-the-data-center-bonanza/
運營/排版:何晨龍





京公網安備 11011402013531號