
![]()
“前華為麒麟SoC總架構(gòu)師、寒武紀(jì)前CTO梁軍,回應(yīng)朋友圈事件。”
作者丨劉伊倫
編輯丨包永剛 林覺民
整個芯片行業(yè)都知道,2022年寒武紀(jì)前CTO梁軍的離職事件,也看到他在2025年1月通過朋友圈公開了與寒武紀(jì)之間的糾紛。
但鮮有人真正了解梁軍到底是一個怎樣的人,及其與前東家之間分歧背后的復(fù)雜背景。
以昉擎科技CEO的新身份,梁軍對雷峰網(wǎng)獨家分享了他創(chuàng)業(yè)的想法,也首次公開講述了那些他與寒武紀(jì)的往事。
他告訴我們,昉擎的整個技術(shù)方案跟此前完全不同,其提出了“上下文相關(guān)”和“上下文無關(guān)”分離的分布式計算結(jié)構(gòu),將任務(wù)分配給更為適用的硬件架構(gòu)進(jìn)行處理,這在全球范圍內(nèi)尚無相似的路徑。
“這樣的系統(tǒng)是有機(jī)會不受現(xiàn)在CUDA這套生態(tài)約束的。”梁軍說道。
而關(guān)于與寒武紀(jì)之間的糾紛,梁軍與寒武紀(jì)CEO陳天石的矛盾爆發(fā)于2021年12月14日,陳天石在自己辦公室里對梁軍說:
“你的權(quán)力比董事長還大!”
“我現(xiàn)在不怕你了。”
三天后,梁軍在公司的IT權(quán)限被關(guān)閉,此前向他匯報的團(tuán)隊,都被直接劃歸陳天石麾下。這發(fā)生在寒武紀(jì)的大算力AI芯片思元590剛剛投片之際。
三個月后,寒武紀(jì)發(fā)布公告,稱“公司核心技術(shù)人員梁軍因與公司存在分歧,通知公司解除勞動合同”。自此,梁軍正式離職,不再擔(dān)任公司任何職務(wù)。
讓梁軍真正難以釋懷的,是他離職后在公司內(nèi)部廣泛流傳的一句話:“寒武紀(jì)上市前給員工的股票發(fā)得少,是因為都給了梁軍。”
他很氣憤,“員工持股平臺‘艾加溪’里我一分沒拿,陳天石自己拿了約400萬股。”
雙方的矛盾最終在2025年1月公開。1月20日,梁軍在朋友圈發(fā)文表示:他被提起訴訟,公司要求他以合計約5.2萬元的價格,轉(zhuǎn)讓其持有的合計約1152萬股寒武紀(jì)公開發(fā)行的A股股票,該案件將于1月23日在北京市海淀法院開庭。而梁軍方面也向海淀法院提起勞動爭議訴訟,要求法院裁定其與寒武紀(jì)之間的勞動關(guān)系,并要求賠償股權(quán)激勵損失超42億元人民幣。
這場庭審定于1月23日進(jìn)行,而前一日(1月22日)正是寒武紀(jì)的公司年會。
法院提前三天通知了梁軍開庭(因為最少是提前三天),當(dāng)時他的律師在外地,留給梁軍及其法律團(tuán)隊的準(zhǔn)備時間極為有限,在這種倉促與被動中,梁軍選擇在朋友圈公開此事。
2024年全年,他已經(jīng)多次向法院提出請求,要求將案件以公開審理的方式進(jìn)行。但這一訴求最終未被采納。
這不僅是個人層面的權(quán)益之爭,也揭示了創(chuàng)業(yè)公司中,早期核心人員在公司治理和股權(quán)結(jié)構(gòu)中所面臨的典型問題。(早期創(chuàng)業(yè)公司股權(quán)糾紛的更多內(nèi)幕,歡迎添加微信YONGGANLL6662互通有無。)
在這場紛爭背后,更不容忽視的是梁軍在中國AI芯片發(fā)展歷程中的深度參與與技術(shù)貢獻(xiàn)。
回顧梁軍的技術(shù)履歷,從華為海思麒麟SoC總架構(gòu)師,到寒武紀(jì)CTO,他見證了國產(chǎn)AI芯片技術(shù)的關(guān)鍵十年。在寒武紀(jì)的五年里,他主導(dǎo)推出了首顆7nm AI訓(xùn)練芯片——思元290,并主導(dǎo)了思元370、590等高性能芯片的研發(fā),以及思元100、270、290、370的量產(chǎn)。
這次在北京與梁軍的面對面對談,讓外界有機(jī)會透過梁軍的視角,了解國產(chǎn)AI芯片發(fā)展的往事。
帶著過去的經(jīng)驗和對未來的判斷,梁軍將開啟新事業(yè),要做一家卓爾不群的科技公司,作為國內(nèi)最懂AI芯片的人,他又有怎樣的思考和判斷?
以下是我們和梁軍的對話,為便于理解,訪談內(nèi)容經(jīng)編輯:
01
回望寒武紀(jì)早期:與華為合作,成為估值暴漲的芯片獨角獸
雷峰網(wǎng):你在2017年加入了寒武紀(jì),當(dāng)時寒武紀(jì)僅成立一年,而你已經(jīng)是麒麟SoC的首席架構(gòu)師,是在之前有了解過他們嗎?
梁軍:2014年,我在華為負(fù)責(zé)手機(jī)SoC期間,每年都會抽出專門的時間看論文,那年看到了陳云霽發(fā)表的論文(《DianNao:一種小尺度的高吞吐率機(jī)器學(xué)習(xí)加速器》,其提出了國際首個深度學(xué)習(xí)處理器框架,該論文第一作者為陳天石),就大概了解了他們的研究方向。
當(dāng)時蘇箐想做貼近AI的技術(shù),但方向不太明確,我就建議他去找陳云霽聊聊,但聊完沒有后續(xù),因為寒武紀(jì)還沒成立。
真正合作是2016年,我負(fù)責(zé)研發(fā)麒麟970,ES(Engineer Sample,工程樣品)版本剛好有空余的芯片面積可以放置AI處理器,就想到了陳云霽做的IP,于是約了陳云霽聊,陳云霽帶著劉道福(寒武紀(jì)聯(lián)合創(chuàng)始人)來華為北研所講了兩個小時,我聽完基本就明白了他們的邏輯。
后來,我在海思內(nèi)部匯報了寒武紀(jì)的IP,高管同意了這個方案,于是我們就把寒武紀(jì)的IP放進(jìn)麒麟970的工程樣片,當(dāng)時不算商業(yè)行為,更多的是“你情我愿”。
雷峰網(wǎng):所以華為跟寒武紀(jì)的合作,其實并不是你加入寒武紀(jì)之后才推動的。
梁軍:內(nèi)外部視角會有一個時間差,麒麟970是2017年秋季發(fā)布的,但芯片的研發(fā)和生產(chǎn)是一個長周期的過程,所以研發(fā)和生產(chǎn)的時間會比產(chǎn)品發(fā)布的時間早出許多。
麒麟970 ES版本在2016年就從晶圓代工廠回來了,麒麟970 CS(Customer Sample,客戶樣品)版本所使用的寒武紀(jì)IP在2016年就已經(jīng)交付給海思。麒麟980所使用的IP版本,在2016年12月我們就已經(jīng)和陳云霽談完IP規(guī)格,寒武紀(jì)同時啟動開發(fā)工作。
后來,我從海思離職時,海思基于市場考慮,又臨時補(bǔ)了一個裁剪版本,那個合同我未參與。在2016年,雙方的IP授權(quán)協(xié)議就已經(jīng)簽署了。
但是我從海思離職是由于其他原因,和2016年我決定采用寒武紀(jì)的IP沒有關(guān)系,和寒武紀(jì)公司關(guān)系也不大,這一點海思高層也完全知曉。
雷峰網(wǎng):華為跟寒武紀(jì)在2019年就解除了合作,合作的時間并不長,這對華為的產(chǎn)品體系有什么影響?
梁軍:其實在2016年簽訂合同的時候,雙方心里就都有數(shù),寒武紀(jì)拿到華為的訂單并非一個長久的事情,這只是在當(dāng)時的情境下,華為選擇的一個過渡方案。
寒武紀(jì)IP的價值,并非設(shè)計有斷層式的領(lǐng)先,而是幫助華為在當(dāng)時快速建立對AI系統(tǒng)的認(rèn)知閉環(huán)。2017年,搭載了寒武紀(jì)IP之后,華為的SoC補(bǔ)全了AI功能,所以當(dāng)時華為整個組織對AI的認(rèn)知要比國內(nèi)其他所有公司都提前1-2年。
昇騰體系后來發(fā)展很快,當(dāng)年通過引入寒武紀(jì)IP搶出1年時間窗口期很關(guān)鍵,華為有整個底層系統(tǒng)以及應(yīng)用場景,能在實際的產(chǎn)品體驗中不斷獲得反饋,其認(rèn)知體系會很不一樣,所以選擇寒武紀(jì)的IP來卡那個時間節(jié)點,沒有錯。
雷峰網(wǎng):你在2017年正式加入了寒武紀(jì),當(dāng)時跟公司是怎么談的?
梁軍:我跟陳天石談Offer的時候,其實兩個人的關(guān)注點不太一樣。我關(guān)注的重點是把股權(quán)寫進(jìn)薪酬項,他關(guān)注的應(yīng)該是我加入后對寒武紀(jì)融資進(jìn)程的影響。
2017年8月18日,寒武紀(jì)宣布完成1億美元A輪融資,由國投創(chuàng)業(yè)領(lǐng)投,阿里巴巴創(chuàng)投、聯(lián)想創(chuàng)投等聯(lián)合投資。但實際上,根據(jù)招股書顯示,這輪融資是在2018年才開始交割的(也就是梁軍入職之后),阿里的那筆投資是2018年5月份MLU100發(fā)布后,7月份資金才真正到賬。
![]()
寒武紀(jì)招股書1-1-61
雷峰網(wǎng):所以你覺得你是被“預(yù)埋”進(jìn)融資里的?
梁軍:我們雙方談合同的時候,股份是按照寒武紀(jì)A輪融資后的股比給我算的,但當(dāng)時的融資款項其實都還沒有到位,看時間線我入職后交割了一部分投資款,我主導(dǎo)MLU100量產(chǎn)以后,阿里的投資款才交割。
在陳天石本人親筆簽署的入職意向書中,明確約定我入職后將于2017年一次性獲授一筆股權(quán),中科寒武紀(jì)在2017年10月18日召開的股東會也對這筆股權(quán)授予有決議,這也是我持有的艾溪合伙的份額的來源,所有的事實,發(fā)生時間是匹配的。
另一方面,寒武紀(jì)當(dāng)時拿著跟華為合作的合同在市場上進(jìn)行融資,合同代表著寒武紀(jì)已經(jīng)有真實的收入、產(chǎn)品有實際的使用場景,2017年底到2018年初,寒武紀(jì)開始收到版稅費,這也讓寒武紀(jì)的估值水漲船高,融資歷程順利了許多,因為風(fēng)險投資機(jī)構(gòu)們之前就沒見過一個能賺錢的初創(chuàng)芯片公司,所以就有很多投資機(jī)構(gòu)搶著投寒武紀(jì)。
雷峰網(wǎng):寒武紀(jì)發(fā)展其實很快,從成立到上市只用了4年,你加入后主要負(fù)責(zé)哪些工作?
梁軍:我加入寒武紀(jì)之前很多事情都是陳云霽在負(fù)責(zé),我加入后接手了研發(fā)工作,并從頭建設(shè)了產(chǎn)品等體系。當(dāng)時寒武紀(jì)主要的團(tuán)隊班子是中科院計算所出來的,團(tuán)隊的成員學(xué)習(xí)能力不錯,但比較缺乏商業(yè)化的經(jīng)驗,也沒有交付過面向商業(yè)市場的芯片和系統(tǒng)產(chǎn)品。
2017年入職后,我研究了公司之前的設(shè)計,早期做的產(chǎn)品其實是一個單核的版本,沒有完整的并行編程模型,研究了一個月之后我就改動了很多設(shè)計,重做了SoC和編程模型,往后的芯片開發(fā)、量產(chǎn)以及硬件體系都是我在負(fù)責(zé),軟件團(tuán)隊也向我匯報,MLU200系列芯片完成開發(fā)以后,我花在軟件團(tuán)隊管理上的時間越來越多。
雷峰網(wǎng):你當(dāng)時有沒有從海思帶人過去?
梁軍:我不愿意從海思招人,這個做法不合適,2018年加入寒武紀(jì)的一般是已經(jīng)離開海思的前員工,從時間節(jié)點上看,2018年其實是海思的高光期,愿意離職加入創(chuàng)業(yè)公司的人也比較少。
雷峰網(wǎng):軟件易用性差是早期寒武紀(jì)產(chǎn)品面臨較多的反饋,中間是走過了什么彎路?
梁軍:一代的軟硬件系統(tǒng)沒有嚴(yán)格定義的并行編程模型,所以做并行計算有很多問題。2017年11月,我把整個編程模型在二代產(chǎn)品里做完了,MLU100投片后,軟件團(tuán)隊的成員也承認(rèn)MLU100原有的那套軟件確實不太行。我們用軟件實現(xiàn)200系列的編程模型,由于缺乏一些硬件支持,做不到完全一致,所以在外界看來就不那么兼容。
2020年之前,底層軟件的設(shè)計在通用性和性能最優(yōu)之間更偏向于追求特定場景下的性能最優(yōu),犧牲了通用性。而面對市場和銷售的現(xiàn)實局面,獲取單個客戶的銷售收入是難以支撐整個研發(fā)的投入的,同時訓(xùn)練產(chǎn)品對底層軟件通用性的要求遠(yuǎn)遠(yuǎn)高于推理產(chǎn)品。
因此,2020年初趁著疫情出差不方便,業(yè)務(wù)線壓力暫緩,迎來一段寶貴的空窗期,于是我們就下定決心做了調(diào)整。之后在2021年我明確了推理和訓(xùn)練兩個業(yè)務(wù)合并軟件版本的要求,團(tuán)隊努力達(dá)成了目標(biāo),國內(nèi)的主要友商在那個時間點做不到這一點。
雷峰網(wǎng):當(dāng)時你負(fù)責(zé)的思元290直接選擇7nm的制程,跳過了12nm這一成熟制程,這樣的選擇是不是冒了一些風(fēng)險?
梁軍:其實風(fēng)險不高。按照臺積電的節(jié)奏,最新的工藝首先用在手機(jī)芯片,然后慢慢提升芯片的良率,后面就可以給更大規(guī)模的芯片,包括AI芯片使用。所以2018年臺積電推出了7nm的制程工藝,2020年英偉達(dá)的A100就是用7nm工藝生產(chǎn)的,同一個工藝,手機(jī)芯片會快兩年。
所以選擇7nm的工藝是提前有技術(shù)預(yù)判的,能夠知道臺積電的生產(chǎn)不會面臨太大的困難,因為歷史上都是這樣的節(jié)奏。
雷峰網(wǎng):思元590在國內(nèi)還是廣泛受到認(rèn)可的,你怎么看待這代產(chǎn)品?
梁軍:590是2021年投片的,那是我做得比較不錯的一個項目,內(nèi)部對此都是有預(yù)期的,比較超乎我預(yù)期的是國內(nèi)其他廠商到2025年還沒追上當(dāng)時這個水準(zhǔn)。
雷峰網(wǎng):有人告訴我們,你離開寒武紀(jì)之后,很多之前你一句話能決定的事情,現(xiàn)在要對接半個月,你怎么看待這樣的現(xiàn)象?
梁軍:海思有一段時間的組織方式是各種疑難問題都交給系統(tǒng)工程師去解決, 做出技術(shù)方案交給開發(fā)團(tuán)隊執(zhí)行,講的通俗一點對系統(tǒng)工程師的要求是十項全能選手,在我負(fù)責(zé)手機(jī)SoC技術(shù)的那幾年,我的組不只是架構(gòu)團(tuán)隊,也包括所有的手機(jī)SoC領(lǐng)域的系統(tǒng)工程師。
我有很長一段時間的工作狀態(tài)是每天早晨8點半開始工作,前一天晚上發(fā)給我匯報狀態(tài),請求給出技術(shù)意見的郵件大概在50-100封,我花2個小時讀完所有郵件,理解所有技術(shù)細(xì)節(jié),給出技術(shù)決策,做的慢了這一天就干不了別的事情,習(xí)慣了。
雷峰網(wǎng):有人評價你比較強(qiáng)勢,好處是效率比較高,壞處是會忽略很多人的意見想法,對此你怎么看?
梁軍:看個人感受吧,我是架構(gòu)師背景,架構(gòu)師的職責(zé)是設(shè)計簡潔的規(guī)則,根據(jù)簡潔的規(guī)則演繹出復(fù)雜系統(tǒng)。如果遇到試圖打破基本規(guī)則的意見,會更傾向于維護(hù)基本的規(guī)則,雖然很多時候意見的提出方并不能意識到這一點。但其實也有很多之前的同事,對我做事的方式很理解。
02
當(dāng)制度滯后于承諾:早期創(chuàng)業(yè)公司面臨的股權(quán)糾紛及信任危機(jī)
雷峰網(wǎng):當(dāng)時你在寒武紀(jì)負(fù)責(zé)研發(fā)和產(chǎn)品體系,這就意味著陳天石管理的是銷售團(tuán)隊?
梁軍:對,銷售團(tuán)隊由陳天石管理,但負(fù)責(zé)研發(fā)和產(chǎn)品就不可避免地需要與銷售團(tuán)隊打交道,因為產(chǎn)品最終銷售不出去,是誰的責(zé)任,這很難界定清楚。寒武紀(jì)情況最好的時間就是2021年的下半年,因為我去管理一些銷售的工作,不去管的話很容易被“攻擊”產(chǎn)品沒有做好。從另外一個方面講,產(chǎn)品是有機(jī)會窗口的,面對市場競爭,錯過機(jī)會窗口的代價很大。
雷峰網(wǎng):所以參與了銷售團(tuán)隊的工作,是導(dǎo)致你們矛盾爆發(fā)的導(dǎo)火索嗎?
梁軍:原先寒武紀(jì)的售前支持和售后支持的團(tuán)隊就是由我負(fù)責(zé),所以我要配合銷售團(tuán)隊的工作,不可避免地與銷售團(tuán)隊打交道。
當(dāng)時也有特殊情況,原來負(fù)責(zé)推理產(chǎn)品的員工因為個人身體原因做了工作調(diào)整,因為一時找不到合適的人選,由我兼任直接管理整個推理產(chǎn)品團(tuán)隊,因為產(chǎn)品規(guī)劃、售前和技術(shù)支持各資源團(tuán)隊原本就向我匯報,當(dāng)我直接管理推理產(chǎn)品時,原有的緩沖沒有了,放大了矛盾。
可以公開講的是之前就有人推波助瀾。2019年下半年,有員工在知乎上匿名發(fā)帖稱:“CEO是董事長,CTO是CEO”,后來頗花了一些精力要求知乎把匿名的帖子刪除了,但是我不能確定陳天石的真實想法。
隨后2020年的時候,寒武紀(jì)北京辦公室在致真大廈D座,我的辦公室從11樓搬到13樓,13樓是新辦公室,那個辦公室門口有個攝像頭,一開始我真沒注意,直到有一天我發(fā)現(xiàn)有銷售團(tuán)隊的人進(jìn)我的辦公室后被訓(xùn)了,那個攝像頭其實就是專門用來觀察誰進(jìn)了我的辦公室,攝像頭的安裝是辦公室裝修的時候就安排好了的。攝像頭安裝在公共區(qū)域,公司里所有人都能看見。
雷峰網(wǎng):“攝像頭事件”之后,又發(fā)生了什么,讓你最終走向離職?
梁軍:2021年12月14日,我跟陳天石進(jìn)行了最后一次對話,他跟我說的第一句話是:“你的權(quán)力比董事長還大!”然后又說了一句:“我現(xiàn)在不怕你了。”
三天后,2021年12月17日,我的公司IT權(quán)限就被關(guān)閉了。他發(fā)了“總經(jīng)理決定”,將原本向我匯報的所有團(tuán)隊改成向他匯報。
12月17日是周五,我周末就緊急找了律師,12月21日在律師幫助下,我發(fā)了一封郵件給陳天石,郵件主要確認(rèn)兩件事情:一,我是否仍然是寒武紀(jì)的副總經(jīng)理;二,公司是否關(guān)閉了我的IT權(quán)限。
雷峰網(wǎng):收到郵件之后,公司有什么反應(yīng)?
梁軍:發(fā)出這封郵件后的兩天,12月23日,公司安排委托人前往天津,對天津玄算九號(寒武紀(jì)的股權(quán)平臺)做了變更備案,備案了一個2021年12月23日的合伙人會議決議,決議的第五條是“原合伙協(xié)議廢止,通過新的合伙協(xié)議”,同時備案了新的合伙協(xié)議,新的合伙協(xié)議里新增了一條條款——第35條。
到了2023年2月,寒武紀(jì)持股委員會發(fā)郵件給我,要求我轉(zhuǎn)讓玄算九號里所持有的股份,由“天津玄思”進(jìn)行回購,我沒有同意,于是天津玄思就根據(jù)之前新增的第35條條款,在2023年5月份起訴我。
2023年11月,在海淀法院組織的庭前談話中,原告的代理律師在庭前談話中表示“梁軍不是寒武紀(jì)的員工”。
雷峰網(wǎng):但有很多證據(jù)證明你是寒武紀(jì)的員工。
梁軍:對,這么做的原因在于陳天石本人簽署的我的入職意向書里關(guān)于股權(quán)的約定,被寫進(jìn)了薪酬項下,對方試圖否定我與寒武紀(jì)之間曾存在勞動關(guān)系,進(jìn)而否定入職意向書的法律效力,再進(jìn)而否定入職意向書里關(guān)于股權(quán)的約定。招股書上也有明確的表述我是寒武紀(jì)的員工,甚至我還是招股書的簽字人。之后我向法院提供了社保記錄、勞動關(guān)系的情況說明等相關(guān)材料。
2024年10月,我正式在海淀法院提起起訴,主要有兩條內(nèi)容:
第一條,請法院確認(rèn)我與中科寒武紀(jì)自2017年10月18日至2022年2月10日期間存在勞動關(guān)系。
第二條,請求中科寒武紀(jì)賠償超過42億元人民幣的股權(quán)激勵損失。
雷峰網(wǎng):關(guān)于股權(quán)的糾紛,公司還有其他的案例嗎,結(jié)果如何?
梁軍:之前公司請了個非常優(yōu)秀的運營專家,寒武紀(jì)從100人的規(guī)模做到了1000人的過程中,她在組織建設(shè)和流程規(guī)范制定上發(fā)揮了很大作用,公司跟其約定的待遇是一半現(xiàn)金、一半股權(quán)。上市公司的股票解禁需要三年,也就是說她的股權(quán)在2023年7月份就解禁,但5月份的時候她就被公司裁了,并且公司要求以原價回購股權(quán)。
后面她以非法裁員申請勞動仲裁,勞動仲裁判她贏了。中科寒武紀(jì)公司上訴至海淀法院一審,現(xiàn)在在等待海淀法院審理。
雷峰網(wǎng):你覺得出現(xiàn)這樣的股權(quán)糾紛,后面對公司的影響大嗎?
梁軍:對公司的影響還是比較大的,因為信任基礎(chǔ)瓦解了。創(chuàng)業(yè)公司最重要的就是股權(quán)激勵,加入早期創(chuàng)業(yè)公司的人看重的都是股權(quán),但員工的股權(quán)最后變得有點像“理財工具”。
招股書顯示,2019年9月(寒武紀(jì)上市前),陳天石向納什均衡轉(zhuǎn)讓了1.8億元價值的股份(向艾溪合伙以36000元對價轉(zhuǎn)讓了2.43%的股份)。
![]()
寒武紀(jì)招股書1-1-62
而后,其又用這筆資金購入了寒武紀(jì)中層以下員工的持股平臺“艾加溪”的股份,當(dāng)時艾加溪持有的中科寒武紀(jì)的股份是17元一股,他用6000多萬元購入了通過艾加溪間接持有的中科寒武紀(jì)約400萬股的股份,大概占艾加溪平臺40%的股權(quán),現(xiàn)在市值20多億元。(注:天津玄算一號及天津玄算二號為員工持股平臺艾加溪的主要股東,其在艾加溪平臺出資比例超90%,而陳天石又是天津玄算一號及天津玄算二號的主要股東。)
![]()
寒武紀(jì)招股書1-1-116
![]()
寒武紀(jì)招股書1-1-124
這筆股權(quán)如果用于招人,大概能招10-20個阿里P9級別的人,那寒武紀(jì)就上了一個臺階,招人的效益比股份增值的效益要大得多。
但是最讓我不滿的是,我離開寒武紀(jì)之后,內(nèi)部流傳出一個聲音說:上市前給員工發(fā)的股票比較少,是因為員工的股權(quán)激勵大部分都給了我,我對這件事情特別氣憤,因為我間接持有的所有中科寒武紀(jì)的股份均依據(jù)陳天石本人親自簽署的入職意向書獲得,艾加溪平臺我一股都沒持有。
雷峰網(wǎng):后來你發(fā)的朋友圈在整個行業(yè)內(nèi)的影響很大,是這個事情導(dǎo)致的嗎?
梁軍:發(fā)朋友圈是2025年1月21日,法院提前三天通知我開庭(因為最少提前三天),當(dāng)時我的律師還在外地,幾乎沒有給我們留出反應(yīng)的時間。
1月23日開庭,1月22日是寒武紀(jì)的年會。
雷峰網(wǎng):在朋友圈里面你也提到,你對寒武紀(jì)發(fā)起訴訟,這是在被起訴股權(quán)之后發(fā)生的?
梁軍:首先,寒武紀(jì)持股委員會2023年年初發(fā)郵件稱要回購我持有的公司股份,要求我按出資額將我在艾溪合伙的股份轉(zhuǎn)讓給新注冊的合伙企業(yè)寒武眾志,將我在天津玄算九號的股份轉(zhuǎn)讓給天津玄思。
所以是用寒武眾志和天津玄思的名義在2023年5月對我發(fā)起訴訟,寒武紀(jì)這個主體并沒有出面。
后續(xù)我要求法院公開審理,但原告向法院遞交了申請,申請中寫明因涉及上市公司中科寒武紀(jì)機(jī)密,申請閉門審理。對此,我就要求追加中科寒武紀(jì)進(jìn)來作為第三人,但是未獲得法院支持。
在訴訟過程中,原告的代理律師不止一次表示“梁軍不是寒武紀(jì)的員工”,因此我于2024年10月在海淀法院發(fā)起了訴訟。
雷峰網(wǎng):距離你發(fā)朋友圈已經(jīng)過去半年,現(xiàn)在官司的進(jìn)度怎么樣?
梁軍:還在等待一審判決,更多的細(xì)節(jié)就不展開講了。
雷峰網(wǎng):你希望最終雙方能達(dá)成什么結(jié)果?
梁軍:既然大家不是一路人,就各走各的路,把賬算清楚就好了。從已經(jīng)發(fā)生的事實看,錢上的糾葛如果要徹底的了解,依賴于雙方的認(rèn)知水平,僅從一方出發(fā)難以解決。
發(fā)生沖突后,其單方面去修改合伙協(xié)議,而我做為中科寒武紀(jì)的前副總經(jīng)理、CTO,要給法院準(zhǔn)備正式文件,說明我確實和中科寒武紀(jì)曾經(jīng)存在勞動關(guān)系,以及存在勞動關(guān)系的時間,這就像是被拖進(jìn)爛泥地摔跤,過程很不堪。從另一個角度看,在爛泥地上摔跤也是人生經(jīng)歷,我對人性的認(rèn)知相比以前深刻很多。
03
基于分布式計算架構(gòu),昉擎科技有機(jī)會突破CUDA的生態(tài)約束
雷峰網(wǎng):你深度參與了國產(chǎn)AI芯片行業(yè)的發(fā)展,覺得行業(yè)發(fā)生的最大變化是什么?
梁軍:行業(yè)的變化是很明顯的,2022年是一個節(jié)點,在這之前CV模型(Computer Vision Model,計算機(jī)視覺模型)很碎,而且模型變化特別多,沒有一個占主導(dǎo)地位的模型,對于追趕者要求同時適配如此多的模型,對軟件的要求比較高,2023年之后基本上都統(tǒng)一到Transformer Decoder Only的模式,基礎(chǔ)模型歸一化,整個底層的設(shè)計就發(fā)生了變化,對整個系統(tǒng)的規(guī)模還有通信的要求都上升了,系統(tǒng)設(shè)計里通信占越來越大的比重。
雷峰網(wǎng):傳統(tǒng)CV到Transformer之后,很多人都在討論NPU和GPGPU的路線要怎么去選擇,你怎么看待這個問題?
梁軍:這個問題的本質(zhì)在于英偉達(dá)是先發(fā)者,擁有最多的社區(qū)開發(fā)人員,所以其上層軟件系統(tǒng)非常全面,社區(qū)每天還在持續(xù)開發(fā)新的特性,做各種優(yōu)化。你只要搭上CUDA這條船,就能夠自動獲得很多特性。如果你在英偉達(dá)之外開發(fā)一套系統(tǒng),會面臨比較大的壓力,一方面沒有英偉達(dá)有錢,另一方面是生態(tài)上有很多風(fēng)險,無法兼容CUDA會降低客戶的使用體驗,在銷售端就會變得困難,所以選擇NPU還是GPGPU,首先是一個商業(yè)的考量,其次才是技術(shù)的考量。
雷峰網(wǎng):現(xiàn)在AI芯片都在推崇更大的算力,怎么看待這樣的現(xiàn)象?
梁軍:當(dāng)你要大規(guī)模訓(xùn)練模型的時候,你肯定希望用最短的時間完成模型的訓(xùn)練,所以你追求整個系統(tǒng)的性能,訓(xùn)練是偏向于絕對的性能。
但是這并不是市場的全部,因為市場是有多樣性的。具體到推理的話,推理的問題在于支持基礎(chǔ)功能以后,產(chǎn)品要有性價比,我這里講的性價比包括客戶導(dǎo)入新的硬件平臺所支付的成本,很多市場擠不進(jìn)去的原因在于產(chǎn)品性價比不如英偉達(dá)。
客戶的需求可以簡單分成兩種:一種是業(yè)務(wù)需要最快的速度上線,這種階段由于英偉達(dá)有生態(tài)優(yōu)勢,與其競爭會有較大壓力。另一個是客戶的系統(tǒng)和需求已經(jīng)穩(wěn)定了,需要的是優(yōu)化成本,在基礎(chǔ)模型都已經(jīng)統(tǒng)一成Transformer Decoder Only的背景下,這對中國公司而言是一些機(jī)會,你就是投錢投人把整個系統(tǒng)做好,在控制客戶切換平臺的成本,控制自己投入的支持成本的約束下來承接訂單。從2025年開始,中國的模型開始在開源社區(qū)占據(jù)主導(dǎo)地位,對此也有很大助力。
雷峰網(wǎng):現(xiàn)在AI芯片都在貼著算法演進(jìn),算法變化又非常快,芯片企業(yè)在技術(shù)架構(gòu)上怎么保持前瞻性?
梁軍:本質(zhì)上看,這套系統(tǒng)是一套并行的系統(tǒng),所以核心是你在最開始搭建通用的編程以及基礎(chǔ)性的架構(gòu)(不一定是GPGPU),然后根據(jù)算法需求去做一些定制加速,并非從一開始就做非常定制化的系統(tǒng)。英偉達(dá)就是這樣,它首先建立了一個通用的GPGPU的架構(gòu),包括指令集、核的設(shè)計、互聯(lián)以及編程模型,以及在此之上的工具鏈,軟件棧。
根據(jù)算法需求同步設(shè)計最合適的硬件去做加速,同時又謹(jǐn)慎的維護(hù)編程的通用性不受影響。英偉達(dá)的PTX指令集的演進(jìn),一直遵循這個原則,所以算法的變化并不構(gòu)成架構(gòu)設(shè)計的一個障礙,雖然英偉達(dá)Tensor Core的設(shè)計,已經(jīng)演進(jìn)到相當(dāng)復(fù)雜。
對于一家創(chuàng)業(yè)公司而言,如果做完硬件再去跟進(jìn)軟件,然后發(fā)現(xiàn)硬件的通用性不夠,要對底層架構(gòu)進(jìn)行修改,那之前的所有在軟件上的投入就變成了負(fù)擔(dān),而非正資產(chǎn),核心是從一開始就特別小心的去做權(quán)衡取舍,在維護(hù)編程的通用性和專用硬件做性能加速之間的平衡上要謹(jǐn)慎。
雷峰網(wǎng):那昉擎如何去做這個權(quán)衡取舍?
梁軍:采用SIMT(單指令多線程)路線,做類似CUDA的編程模型是一個選擇,但是仍要面對CUDA是英偉達(dá)的私有系統(tǒng)的現(xiàn)實約束。2021年下半年RISC-V RVV(RISC-V向量擴(kuò)展) V1.0版本發(fā)布之后,就多了一個選擇。從客戶的角度,采購新的硬件計算平臺,同時也是做軟件投資,采用開源的指令集設(shè)計而非私有指令集,對客戶而言軟件投資的風(fēng)險會大幅降低。
從純技術(shù)角度看,RISC-V RVV缺乏面向AI計算的一些基礎(chǔ)特性,但整體架構(gòu)層面的完成度還可以,指令集的定義出發(fā)點是面向通用計算,在此基礎(chǔ)上做適當(dāng)擴(kuò)展就可以了。
從我們的角度看,兩種路線屬于尺有所長,寸有所短,沒有強(qiáng)烈偏好。任何一種路線做好了都可以滿足市場需求,但是在維護(hù)編程的通用性和專用硬件做加速之間做適當(dāng)?shù)钠胶猓诖朔矫娴男枨笫且恢碌模枰浻布F(tuán)隊對此有正確的認(rèn)知。NVIDIA PTX指令集的演進(jìn)是很好的參考,英偉達(dá)在這方面是業(yè)界最佳水準(zhǔn)。
雷峰網(wǎng):現(xiàn)在基于RISC-V去做AI芯片的公司也很多,各家有什么差別?
梁軍:現(xiàn)在不同的公司做出來的產(chǎn)品可能差幾個量級,因為RISC-V本身缺乏一些面向AI計算所需要的特性,而AI的整個系統(tǒng)和計算核的設(shè)計思路和傳統(tǒng)的CPU核設(shè)計思路差別很大,有的公司按照傳統(tǒng)CPU思路做出來的產(chǎn)品就不太適用于AI計算。
專門做AI計算每一個環(huán)節(jié)其實都需要重新做,你只是用RISC-V的指令集,其他的東西包括指令的擴(kuò)展和實現(xiàn)都要從頭開始做。
雷峰網(wǎng):選擇分布式架構(gòu)這個路線,能繞過CUDA生態(tài)嗎?
梁軍:昉擎采用上下文相關(guān)和上下文無關(guān)分離的分布式架構(gòu)做了設(shè)計,從2012年CNN( Convolutional Neural Network 卷積神經(jīng)網(wǎng)絡(luò))開始到目前為止,上下文相關(guān)和上下文無關(guān)的概念其實一直存在于算法的演進(jìn)當(dāng)中,只是在之前CV時代沒有那么明顯,Transformer時代讓這個架構(gòu)更明顯,我們預(yù)期Transformer之后仍會維持這樣的算法結(jié)構(gòu)。
我們的認(rèn)知是上下文相關(guān)和上下文無關(guān)分離,不僅僅是算法結(jié)構(gòu),同時也是一種可擴(kuò)展的計算架構(gòu),行業(yè)內(nèi)近期有關(guān)于Attention和FFN分離的熱烈討論,我們認(rèn)為上下文相關(guān)(context aware)和上下文無關(guān)(context free)分離是更合適,更抽象的表述是,具體到Transformer網(wǎng)絡(luò)體現(xiàn)為Attention和FFN分離,昉擎以后也會使用上下文相關(guān)與上下文無關(guān)相分離這樣的表述。
采用分布式的計算架構(gòu),系統(tǒng)的設(shè)計從一維擴(kuò)展變成了二維擴(kuò)展,也重構(gòu)了設(shè)備的交互模式。昉擎基于這個原生異構(gòu)系統(tǒng)的角度去切入市場,是有機(jī)會不受CUDA生態(tài)約束的。
雷峰網(wǎng):你提到了重構(gòu)設(shè)備的交互模式,所以昉擎是會切入窄場景但高頻剛需的AI硬件,像可穿戴設(shè)備那些場景?
梁軍:AI硬件最大的問題是沿用傳統(tǒng)的SoC思路去做,這會面臨內(nèi)存容量受限、內(nèi)存帶寬受限以及性能受限的約束。行業(yè)討論說把模型做小,然后放到單個設(shè)備里面,這就會犧牲很多模型的能力,這是現(xiàn)有方案面臨的問題。分布式架構(gòu)中,上下文相關(guān)處理輸入輸出,上下文無關(guān)處理模型權(quán)重,這樣在兩個維度上各自擴(kuò)展,可以從兩個維度去定義系統(tǒng),有機(jī)會做出顛覆性的產(chǎn)品。
手機(jī)的SoC系統(tǒng)改成分離式架構(gòu)之后,手機(jī)、智能眼鏡、智能耳機(jī)、智能手表等設(shè)備都可以作為獨立的輸入輸出處理器接入權(quán)重處理器,或者講傳統(tǒng)意義上的SoC處理上下文相關(guān)部分,系統(tǒng)里新增一個權(quán)重處理器處理上下文無關(guān)部分。所以只要你認(rèn)為模型的能力會越來越強(qiáng),各種IO處理器,像耳機(jī),眼鏡這部分設(shè)備只需要接入權(quán)重處理器就可以獨立完成更多的功能,在現(xiàn)有的系統(tǒng)定義里這些設(shè)備是手機(jī)SoC的附屬設(shè)備,在新的系統(tǒng)里這些設(shè)備和手機(jī)SoC是對等的。我們認(rèn)為這樣的設(shè)計,有機(jī)會開拓出新的系統(tǒng)形態(tài),創(chuàng)造出新的市場。
雷峰網(wǎng):昉擎是第一個做分布式架構(gòu)的公司,如果其他企業(yè)跟進(jìn),市場留給你們的窗口期有多長?
梁軍:其他廠商跟進(jìn)來做這個事情不可避免,但是分布式架構(gòu)需要設(shè)計面向延遲優(yōu)化設(shè)計的系統(tǒng),而傳統(tǒng)GPU的設(shè)計思路是面向吞吐做優(yōu)化,所以整個設(shè)計的思路和實現(xiàn)方式完全不一樣,昉擎有比較充足的時間窗口期。
其他公司如果跟進(jìn),那它們之前的積累就變成了負(fù)擔(dān),而非資產(chǎn)。此外,這個領(lǐng)域的技術(shù)此前較少受到關(guān)注,我們也在積極申請知識產(chǎn)權(quán)保護(hù)。
從技術(shù)演進(jìn)的角度看,分布式架構(gòu)只是第一步,在引入分布式架構(gòu)以后,可以更清楚的認(rèn)知到計算范式的轉(zhuǎn)移,從以處理器為中心的計算系統(tǒng)設(shè)計轉(zhuǎn)移到以Memory為中心的計算系統(tǒng)設(shè)計,在AI模型大行其道的當(dāng)下,計算范式的轉(zhuǎn)移是事實,但是還未被廣泛的認(rèn)知,這也是近年來存內(nèi)計算和近存計算等概念行業(yè)內(nèi)聲音很大的真正原因,只是當(dāng)下的討論很大程度上是從硬件視角出發(fā)的認(rèn)知,從計算范式轉(zhuǎn)移的角度會有全新的解釋。
無論KV Cache, 還是權(quán)重,在很大程度上都可以定義為Memory,有一些計算的屬性,但是更多的表現(xiàn)為Memory,只不過不是傳統(tǒng)意義上的輸入地址,讀寫數(shù)據(jù)的Memory,而是有新增的計算以及通信的屬性。
我們的看法,沿著這個路線走下去,有機(jī)會定義出新型的Memory器件。做這種前沿的技術(shù)開發(fā)以及產(chǎn)品定義,也是昉擎做為創(chuàng)業(yè)公司存在的價值所在。
所以有其他廠商跟進(jìn),對昉擎而言不算壞事情,說明我們的技術(shù)路線得到行業(yè)內(nèi)其他公司的認(rèn)同。我們也有自信,因為我們起步早,也希望我們的技術(shù)路線得到其他廠商的認(rèn)同。
雷峰網(wǎng):那在產(chǎn)品體系上,昉擎是怎樣去做規(guī)劃的?
梁軍:昉擎的第一代產(chǎn)品是給市場驗證分布式系統(tǒng),所以主要目的是做出一款具備超出市場預(yù)期的性能及可用性的產(chǎn)品,讓市場了解到這是一條可行的路。
隨后就要開始做下一代產(chǎn)品,昉擎面臨的核心問題是在技術(shù)平臺準(zhǔn)備完畢后,找到一個最方便切入且效果最好的領(lǐng)域。
雷峰網(wǎng):那現(xiàn)在找到這個產(chǎn)品領(lǐng)域了嗎?
梁軍:有具體方向,但目前不方便公開。
雷峰網(wǎng):從華為到寒武紀(jì),你有豐富的團(tuán)隊管理經(jīng)驗,現(xiàn)在怎么去搭建昉擎的團(tuán)隊?
梁軍:昉擎的團(tuán)隊建設(shè)非常精干,我們的目標(biāo)是做技術(shù)領(lǐng)先的公司,團(tuán)隊人少是優(yōu)勢,因為更多的時間可以用于思考技術(shù)本身,而非管理,從實際執(zhí)行的過程看,當(dāng)前我維持這一判斷。
雷峰網(wǎng):那之前的這兩段經(jīng)歷,對你創(chuàng)業(yè)有什么幫助?
梁軍:我是2000年加入華為,一直到2012年都在做網(wǎng)絡(luò)芯片的架構(gòu)設(shè)計,之后負(fù)責(zé)手機(jī)SoC的技術(shù)方案。我把架構(gòu)師這個角色分為幾個檔次:
第一檔,是有能力合理設(shè)計簡潔的規(guī)則,并能夠根據(jù)簡潔的規(guī)則演繹出復(fù)雜的系統(tǒng);
第二檔,是在開發(fā)以及系統(tǒng)演進(jìn)的過程中,有能力維護(hù)基礎(chǔ)的規(guī)則不被違背,并根據(jù)系統(tǒng)演進(jìn)需要定義規(guī)則的演進(jìn);
第三檔,是可以認(rèn)知到好的架構(gòu)設(shè)計,對比在開發(fā)團(tuán)隊能力以及進(jìn)度要求等約束下可以執(zhí)行好的架構(gòu)設(shè)計,二者之間的區(qū)別,是能夠有意識地做出合理的取舍。
我在做網(wǎng)絡(luò)芯片時是在第二個檔次上做事,十年前我負(fù)責(zé)手機(jī)SoC技術(shù)時,是在第三個檔次上做事,我對架構(gòu)師這個角色的認(rèn)知是頂級水準(zhǔn),在華為的過往經(jīng)歷對此幫助極大。
從產(chǎn)品方面,我負(fù)責(zé)手機(jī)SoC的技術(shù)以后,一直在競爭最激烈的市場上,和全球最頂級的公司做競爭,這段經(jīng)歷使得我對產(chǎn)品的認(rèn)知提升到了一個新的層面。
在海思的最后幾年,我有很多精力投入在技術(shù)管理工作。行業(yè)內(nèi)很多人講芯片產(chǎn)品體系是“預(yù)研一代、開發(fā)一代、量產(chǎn)一代”,這個說法最早其實是我在2015年年初在海思內(nèi)部提出來的。當(dāng)時麒麟950剛完成投片,我在內(nèi)部提出以此為標(biāo)志,組織進(jìn)入了一個新的階段,開始有固定的一年一代的產(chǎn)品節(jié)奏,為了適應(yīng)這個變化,我明確指出用“預(yù)研一代、開發(fā)一代、量產(chǎn)一代”做為方法論來管理各個技術(shù)領(lǐng)域,每個領(lǐng)域每年依據(jù)產(chǎn)品節(jié)奏都要分別審視三個維度的工作。
由于這個說法簡單又好理解,后來就被各個領(lǐng)域的團(tuán)隊做為工作的指導(dǎo)原則。也是因為負(fù)責(zé)手機(jī)SoC這種復(fù)雜系統(tǒng)的技術(shù)工作,才有機(jī)會對技術(shù)管理怎么做有深刻認(rèn)知。
到了寒武紀(jì)之后,我是寒武紀(jì)的77號員工,經(jīng)歷了公司從100人擴(kuò)張到1000人的階段,建立了各個技術(shù)平臺,研發(fā)和產(chǎn)品體系,“親自賣貨”的經(jīng)歷使得我對整個商業(yè)閉環(huán)的認(rèn)知,對公司運營的認(rèn)知,相比之前有很大的提升。過去數(shù)年的經(jīng)歷,我對人性的認(rèn)知相比之前深刻很多。有意思的是這么折騰一圈,我對技術(shù)和產(chǎn)品的認(rèn)知,相比之前又上了一個大臺階,所以現(xiàn)在做創(chuàng)業(yè)公司,自我感覺處在歷史上最好的狀態(tài)。
關(guān)于華為、寒武紀(jì)更多的內(nèi)幕故事,以及梁軍對技術(shù)路線的研判,歡迎添加微信YONGGANLL6662交流更多信息。






京公網(wǎng)安備 11011402013531號