核心模型被曝蒸餾DeepSeek？前女友一紙控訴，曝出歐版OpenAI塌房真相！

IP屬地中國·北京 編輯：任飛揚新智元 時間：2025-08-15 20:17:35

新智元報道
編輯：Aeneas KingHZ
曾被譽為「歐洲OpenAI」的Mistral AI，陷入「抄襲」丑聞！在分手小作文中，前員工爆料核心技術是蒸餾DeepSeek，卻誤導外界稱為自主RL成果。
Mistal套殼DeepSeek，被當場抓現行了？
幾天前就有人在X上爆料：Mistral的新模型是直接蒸餾自DeepSeek，而且基準測試結果還被歪曲了。
這個被視為歐洲版OpenAI「全村希望」的公司，地位就如同中國的DeepSeek一般，如今居然塌房了？
這實在是太魔幻了。

更為勁爆的是，這個重磅大瓜還是從一篇Mistral女員工的「分手小作文」里曝出來的。

原話是這樣的——
你早知道Mistral做事不講道德：把DeepSeek蒸餾后當成自己的模型，使用OpenAI的數據，對外卻誤導稱是RL在發揮作用，但它實際上只是DS3的產物，還歪曲基準測試結果。
你不僅明知這些，還積極參與其中。當我指出這些問題時，你沒有承擔任何責任，反而選擇無視我、對我冷處理。
情感糾紛小作文
曝出套殼大瓜
也就是說，這位Mistral離職的女員工，不僅在小作文中曝光了自己和前男友、Mistral同事的感情糾葛，還爆出Mistral套殼DeepSeek的丑聞。
這個消息一曝光，立馬在全網引起了軒然大波。
DeepMind研究員Susan Zhang轉發并評論，直接點名Mistral AI的不道德行為。

在「小作文」里，這位Mistral前員工痛訴自己如何接連遭遇上司排擠、伴侶出軌、求職無望，還要靠抗抑郁藥物試圖讓情感生活重回正軌。

關鍵節點在2025年4月初， Mistral把她解雇了，原因在于工作分歧：
她明確反對通過蒸餾DeepSeek來誤導用戶。
這加劇了她對Mistral高層的不滿——而她的伴侶又和高層關系密切。
在職業前途未卜、經濟壓力加劇、感情關系又充滿不確定的三重打擊下，她開始崩潰。
這讓DeepMind研究科學家Andreas Kirsch非常同情。
Mistral的「秘方」竟是DeepSeek，這一事實讓人無語。

火眼金睛博主
早發現Mistral蒸餾DeepSeek
其實早在今年6月，就有一位火眼金睛的AI行內人發現，Mistral Small 3.2寫的東西，它怎么這么像DeepSeek呢！
這位名為Sam Paech的行內人，同時還是EQ-Bench基準的維護者，可謂十分有眼光。

為了比較Mistral-small-3.2和DeepSeek-v3之間的相似性，這位博主在模型的創意寫作輸出中，提取了跟人類基線相比最過度呈現的單詞和n-gram詞組。

通過對這些詞/n-gram中的前幾百個數據特征進行層次聚類，生成了一張如下的相似性圖。
肉眼可見，Mistral-small-3.2和DeepSeek-v3在譜系圖中的位置非常接近，從而表明它們的特征是極其相似的。

這個過程中，他使用了一個生物信息學工具，基于slop特征譜的相似性，推斷出了譜系樹。

Susan Zhang對此直接表示，Mistral這身皮被扒下來，原來是DeepSeek啊！

甚至還有人發現，連Gemini Pro 2.5都和DeepSeek-R1之間有非常相似的感覺。
比如DeepSeek-R1非常擅長在對話中保持角色的一致性，而Gemini Pro 2.5也是如此，簡直驚人的相似。

蒸餾不是錯
HuggingFace聯合創始人兼首席執行官表示，蒸餾開源模型有錯嗎？

畢竟，開源的意義之一就是讓大家「自由使用」源代碼，所以DeepSeek并不會禁止蒸餾。
而且蒸餾大模型也不簡單，DeepSeek蒸餾自己的R1模型就不太成功。Paech本人也表示，其實蒸餾也不算什么大錯，現在很多模型都是這么干的。

技術上，蒸餾是通過讓小模型模仿大模型的輸出結果來實現的。
大模型會把自己的「經驗」（比如語言模式、寫作風格）以一種簡單的方式傳給小模型。小模型通過大量練習，逐漸學會了類似的表現，但用更少的計算資源。
這種方法在AI領域很流行，因為這項技術很實用，比如能讓大模型跑在手機或其他低性能設備上。
蒸餾本身不是錯，編造謊言才是問題的實質！

說到頭來，Mistral的問題不在于蒸餾DeepSeek，而在于把模型的進步歸功于自家的RL方法，甚至蓄意改變基準測試。
沒有清楚標注模型是蒸餾的，缺乏透明度，才是最關鍵的問題。

Mistral好像不止一次這么干，博士生Regi Kusumaatmadjia就發現Mistral的OCR功能與Mineru的OCR出奇的相似。

Mistral過去的高光時刻
想當初，Mistral可是深夜發一條磁力鏈接，就能讓整個開源圈震撼的存在。
在今年2月，才成立一年多的Mistral AI已經估值62億美金，成為法國的驕傲，歐洲的驕傲。
歐洲的開發者們一度歡呼：恭喜Mistral AI，讓歐洲在AI競賽中終于有了一席之地。

Mistral AI的超級應用助手Le Chat，還一度登頂法國免費APP的榜首。

馬克龍一直以來也積極支持Mistral，稱其為：「法國人工智能產業的皇冠上瑰寶」。

2023年，這三位來自谷歌DeepMind、meta的前員工希望打造一家遵循歐洲模式的AI公司——開源、高效、注重隱私。

隨后，他們就用自己的方式，顛覆了硅谷的傳統。
在當時，當OpenAI斥資超1億美金訓練GPT-4時，Mistral僅用2200萬美元就打造出了最具競爭力的AI模型。

甚至馬克龍還信誓旦旦表示，法國未來幾年將投資1090億歐元用于建設AI，盡最大努力為包括Mistral在內的公司創造空間。

在成立僅僅七個月的時間里，Mistral就在兩個主要「權重級別」上發布了SOTA開源大語言模型（mistral-7b 和 mixtral）。
Mistral在底層架構持續取得突破（如sparse mixture-of-experts，稀疏專家混合架構）。
這對一家初創公司而言，成就非凡。
剛剛，他們還推出了Mistral Medium 3.1，表示整體性能提升巨大。

不過，這次推文底下質疑聲不斷。

誰都沒想到，當初承載了多少人希望的Mistral，如今竟發展到了這一步。
參考資料：
https://x.com/ns123abc/status/1955044877110071480
https://x.com/gmmvg/status/1955002717698658719
https://x.com/paulopacitti/status/1955003793927524717

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

京瓷推出DIGNO BX3個人版手機：無攝像頭設計專為保密場所打造

iOS 26.1停止簽名，蘋果iPhone 17等用戶升級iOS 26.2后無法降級

美媒：TikTok將在美國成立合資公司

消息稱三星考慮為Galaxy Z Flip 8小折疊手機搭載Exynos 2600芯片

避開蘋果“催更”，iPhone 16等用戶可加入公測版留守iOS 18

“25km/h”還是“配送超時”？該答題的不應只是騎手 | 鋒面評論

全站最新

京瓷推出DIGNO BX3個人版手機：無攝像頭設計專為保密場所打造

iOS 26.1停止簽名，蘋果iPhone 17等用戶升級iOS 26.2后無法降級

美媒：TikTok將在美國成立合資公司

消息稱三星考慮為Galaxy Z Flip 8小折疊手機搭載Exynos 2600芯片

熱門推薦

谷歌大舉回聘離職員工補強AI團隊

北京人形XR-1模型開源

偽科普有哪些常見套路（嘮“科”）

上海加快建設具有全球影響力的科創高地

獲L3級自動駕駛準入許可長安汽車迎逾二百家機構調研

京瓷推出DIGNO BX3個人版手機：無攝像頭設計專為保密場所打造

iOS 26.1停止簽名，蘋果iPhone 17等用戶升級iOS 26.2后無法降級

巴基斯坦媒體：中國快遞行業迅速增長，“西藏包郵”正逐漸成為現實

美媒：中國降低全球邁入AI時代的門檻

美媒：TikTok將在美國成立合資公司

消息稱三星考慮為Galaxy Z Flip 8小折疊手機搭載Exynos 2600芯片

避開蘋果“催更”，iPhone 16等用戶可加入公測版留守iOS 18

“25km/h”還是“配送超時”？該答題的不應只是騎手 | 鋒面評論

河北地質大學“龍人”研究成果入選《科學》雜志2025年度十大科學突破

聚焦雄安新區丨氣象人工智能科學模型“風源”在雄安發布