![]()
新智元報道
編輯:Aeneas KingHZ
曾被譽為「歐洲OpenAI」的Mistral AI,陷入「抄襲」丑聞!在分手小作文中,前員工爆料核心技術是蒸餾DeepSeek,卻誤導外界稱為自主RL成果。
Mistal套殼DeepSeek,被當場抓現行了?
幾天前就有人在X上爆料:Mistral的新模型是直接蒸餾自DeepSeek,而且基準測試結果還被歪曲了。
這個被視為歐洲版OpenAI「全村希望」的公司,地位就如同中國的DeepSeek一般,如今居然塌房了?
這實在是太魔幻了。
![]()
更為勁爆的是,這個重磅大瓜還是從一篇Mistral女員工的「分手小作文」里曝出來的。
![]()
原話是這樣的——
你早知道Mistral做事不講道德:把DeepSeek蒸餾后當成自己的模型,使用OpenAI的數據,對外卻誤導稱是RL在發揮作用,但它實際上只是DS3的產物,還歪曲基準測試結果。
你不僅明知這些,還積極參與其中。當我指出這些問題時,你沒有承擔任何責任,反而選擇無視我、對我冷處理。
情感糾紛小作文
曝出套殼大瓜
也就是說,這位Mistral離職的女員工,不僅在小作文中曝光了自己和前男友、Mistral同事的感情糾葛,還爆出Mistral套殼DeepSeek的丑聞。
這個消息一曝光,立馬在全網引起了軒然大波。
DeepMind研究員Susan Zhang轉發并評論,直接點名Mistral AI的不道德行為。
![]()
在「小作文」里,這位Mistral前員工痛訴自己如何接連遭遇上司排擠、伴侶出軌、求職無望,還要靠抗抑郁藥物試圖讓情感生活重回正軌。
![]()
關鍵節點在2025年4月初, Mistral把她解雇了,原因在于工作分歧:
她明確反對通過蒸餾DeepSeek來誤導用戶。
這加劇了她對Mistral高層的不滿——而她的伴侶又和高層關系密切。
在職業前途未卜、經濟壓力加劇、感情關系又充滿不確定的三重打擊下,她開始崩潰。
這讓DeepMind研究科學家Andreas Kirsch非常同情。
Mistral的「秘方」竟是DeepSeek,這一事實讓人無語。
![]()
火眼金睛博主
早發現Mistral蒸餾DeepSeek
其實早在今年6月,就有一位火眼金睛的AI行內人發現,Mistral Small 3.2寫的東西,它怎么這么像DeepSeek呢!
這位名為Sam Paech的行內人,同時還是EQ-Bench基準的維護者,可謂十分有眼光。
![]()
為了比較Mistral-small-3.2和DeepSeek-v3之間的相似性,這位博主在模型的創意寫作輸出中,提取了跟人類基線相比最過度呈現的單詞和n-gram詞組。
![]()
通過對這些詞/n-gram中的前幾百個數據特征進行層次聚類,生成了一張如下的相似性圖。
肉眼可見,Mistral-small-3.2和DeepSeek-v3在譜系圖中的位置非常接近,從而表明它們的特征是極其相似的。
![]()
這個過程中,他使用了一個生物信息學工具,基于slop特征譜的相似性,推斷出了譜系樹。
![]()
Susan Zhang對此直接表示,Mistral這身皮被扒下來,原來是DeepSeek啊!
![]()
甚至還有人發現,連Gemini Pro 2.5都和DeepSeek-R1之間有非常相似的感覺。
比如DeepSeek-R1非常擅長在對話中保持角色的一致性,而Gemini Pro 2.5也是如此,簡直驚人的相似。
![]()
蒸餾不是錯
HuggingFace聯合創始人兼首席執行官表示,蒸餾開源模型有錯嗎?
![]()
畢竟,開源的意義之一就是讓大家「自由使用」源代碼,所以DeepSeek并不會禁止蒸餾。
而且蒸餾大模型也不簡單,DeepSeek蒸餾自己的R1模型就不太成功。Paech本人也表示,其實蒸餾也不算什么大錯,現在很多模型都是這么干的。
![]()
技術上,蒸餾是通過讓小模型模仿大模型的輸出結果來實現的。
大模型會把自己的「經驗」(比如語言模式、寫作風格)以一種簡單的方式傳給小模型。小模型通過大量練習,逐漸學會了類似的表現,但用更少的計算資源。
這種方法在AI領域很流行,因為這項技術很實用,比如能讓大模型跑在手機或其他低性能設備上。
蒸餾本身不是錯,編造謊言才是問題的實質!
![]()
說到頭來,Mistral的問題不在于蒸餾DeepSeek,而在于把模型的進步歸功于自家的RL方法,甚至蓄意改變基準測試。
沒有清楚標注模型是蒸餾的,缺乏透明度,才是最關鍵的問題。
![]()
Mistral好像不止一次這么干,博士生Regi Kusumaatmadjia就發現Mistral的OCR功能與Mineru的OCR出奇的相似。
![]()
Mistral過去的高光時刻
想當初,Mistral可是深夜發一條磁力鏈接,就能讓整個開源圈震撼的存在。
在今年2月,才成立一年多的Mistral AI已經估值62億美金,成為法國的驕傲,歐洲的驕傲。
歐洲的開發者們一度歡呼:恭喜Mistral AI,讓歐洲在AI競賽中終于有了一席之地。
![]()
![]()
Mistral AI的超級應用助手Le Chat,還一度登頂法國免費APP的榜首。
![]()
馬克龍一直以來也積極支持Mistral,稱其為:「法國人工智能產業的皇冠上瑰寶」。
![]()
2023年,這三位來自谷歌DeepMind、meta的前員工希望打造一家遵循歐洲模式的AI公司——開源、高效、注重隱私。
![]()
隨后,他們就用自己的方式,顛覆了硅谷的傳統。
在當時,當OpenAI斥資超1億美金訓練GPT-4時,Mistral僅用2200萬美元就打造出了最具競爭力的AI模型。
![]()
甚至馬克龍還信誓旦旦表示,法國未來幾年將投資1090億歐元用于建設AI,盡最大努力為包括Mistral在內的公司創造空間。
![]()
在成立僅僅七個月的時間里,Mistral就在兩個主要「權重級別」上發布了SOTA開源大語言模型(mistral-7b 和 mixtral)。
Mistral在底層架構持續取得突破(如sparse mixture-of-experts,稀疏專家混合架構)。
這對一家初創公司而言,成就非凡。
剛剛,他們還推出了Mistral Medium 3.1,表示整體性能提升巨大。
![]()
不過,這次推文底下質疑聲不斷。
![]()
![]()
![]()
![]()
誰都沒想到,當初承載了多少人希望的Mistral,如今竟發展到了這一步。
參考資料:
https://x.com/ns123abc/status/1955044877110071480
https://x.com/gmmvg/status/1955002717698658719
https://x.com/paulopacitti/status/1955003793927524717
![]()





京公網安備 11011402013531號