“日本版OpenAI”創(chuàng)下估值新高！Transformer八子之一創(chuàng)辦

IP屬地中國(guó)·北京 量子位 時(shí)間：2025-11-19 16:22:51

剛剛，創(chuàng)下日本估值新高的AI初創(chuàng)公司誕生了！
它就是Sakana AI，由Transformer論文八子之一創(chuàng)辦，老黃的英偉達(dá)也投了。

幫大家快速回憶一下，這家公司其實(shí)就是史上首位“AI科學(xué)家”背后的出品方——
當(dāng)時(shí)他們發(fā)布的The AI Scientist，一登場(chǎng)就一口氣生成了十篇完整學(xué)術(shù)論文，而且每篇成本才15美元左右（約107.62元），一時(shí)吸引大量關(guān)注。

根據(jù)Sakana AI公告，最新B輪融資籌集了200億日元（約合1.35億美元、9億多人民幣），總估值來(lái)到約4000億日元（約合26.35億美元、184億人民幣），創(chuàng)下日本非上市初創(chuàng)企業(yè)的估值紀(jì)錄。
而且它的投資方陣容也堪稱豪華——除英偉達(dá)（參與A輪）之外，還有一眾美國(guó)頂級(jí)風(fēng)投（如Khosla Ventures、NEA）和日本產(chǎn)業(yè)與金融巨頭（如三菱日聯(lián)、四國(guó)電力）等。
所以，Sakana AI為什么能獲得如此高估值？
Transformer八子之一創(chuàng)辦、要做基于自然啟發(fā)的AI模型
Sakana AI成立于2023年7月，至今不過(guò)短短兩年。
之所以一開(kāi)始就受到巨大關(guān)注，毫無(wú)疑問(wèn)離不開(kāi)它的兩位明星創(chuàng)始人。
聯(lián)創(chuàng)兼CTO Llion Jones，大名鼎鼎的Transformer論文8位作者之一。

他本碩畢業(yè)于伯明翰大學(xué)，在Delcam、油管、谷歌都工作過(guò)，創(chuàng)辦Sakana AI之前在谷歌工作了8年之久。
據(jù)FourWeekMBA介紹稱，在他之前的工作經(jīng)歷中，“曾兩度與谷歌的工作擦肩而過(guò)”。
第一次是他剛畢業(yè)找工作時(shí)，雖然投了谷歌倫敦軟件工程師的簡(jiǎn)歷，并通過(guò)了兩輪電話面試，但最終相比谷歌，他選擇了位于英國(guó)的CAD/CAM軟件公司Delcam。
第二次是工作18個(gè)月后，他又接到了谷歌的招聘電話，詢問(wèn)他是否想重新申請(qǐng)，但他依舊沒(méi)去谷歌，而是隨后加入了YouTube。
在Youtube做軟件工程師的三年期間，他對(duì)人工智能產(chǎn)生興趣，于是自學(xué)了Coursera的機(jī)器學(xué)習(xí)課程，并終于在2015年的時(shí)候加入谷歌研究院，擔(dān)任里面的高級(jí)軟件工程師。
也正是在此期間，他與其他七名作者一起發(fā)表了那篇著名的Transformer論文《Attention Is All You Need》。

而之所以選擇離開(kāi)谷歌，是因?yàn)楣灸壳耙呀?jīng)發(fā)展到一定規(guī)模，使得他無(wú)法繼續(xù)進(jìn)行自己想做的工作。
按他自己的話來(lái)說(shuō)就是，谷歌確實(shí)讓他有種“被困住的感覺(jué)”。
于是瀟灑一轉(zhuǎn)身，他選擇聯(lián)合另一位谷歌前員工開(kāi)始創(chuàng)業(yè)，而這位谷歌前員工就是如今身為Sakana AI聯(lián)創(chuàng)兼CEO的David Ha。
David Ha（右圖）曾是谷歌大腦的高級(jí)科學(xué)家，也曾領(lǐng)導(dǎo)過(guò)圖像生成模型獨(dú)角獸公司Stability AI的研究部門。
今年8月，他還入選了《時(shí)代》雜志評(píng)選的2025年人工智能領(lǐng)域百大人物榜單。

有了這二人，base東京的Sakana AI可謂自帶光環(huán)。
（注：之所以選擇東京，是因?yàn)楸泵滥沁叺纳墒紸I研究人員競(jìng)爭(zhēng)非常激烈（手動(dòng)狗頭），而在日本這邊競(jìng)爭(zhēng)相對(duì)小一點(diǎn)而且也不乏高質(zhì)量AI人才。）
而且比較新奇的是，Sakana AI并不是要在日本再造一個(gè)OpenAI或Anthropic，而是一開(kāi)始就要走一條“不一樣的路”——
他們希望放棄Transformer架構(gòu)，并從自然進(jìn)化中汲取靈感，以降低模型的計(jì)算成本并提升其性能。
概括而言，他們的想法可以基本歸納為：
1）日本是個(gè)資源有限的國(guó)家，AI發(fā)展到后面肯定會(huì)受到電力等資源的限制，所以從一開(kāi)始就要考慮如何提效；
2）通過(guò)從自然進(jìn)化中汲取靈感，他們能夠?qū)崿F(xiàn)這一目的。
至于究竟是怎樣的自然靈感，這可以從他們給公司起的名字“Sakana AI”（sakana是日語(yǔ)“魚(yú)”（さかな）的羅馬讀音）一窺。

就像大自然中的魚(yú)會(huì)基于某種簡(jiǎn)單的規(guī)則成群活動(dòng)。因此，AI們也能借鑒它們的思想，無(wú)需更大的體積就能完成很復(fù)雜的任務(wù)。
具體來(lái)說(shuō)，Sakana AI計(jì)劃開(kāi)發(fā)一種基于自然啟發(fā)智能（nature-inspired intelligence）的基礎(chǔ)模型，借鑒自然領(lǐng)域中的“進(jìn)化”和“集體智慧”思想，讓一群AI協(xié)作，類似于當(dāng)前AI領(lǐng)域的生物啟發(fā)計(jì)算方向。
據(jù)《金融時(shí)報(bào)》介紹稱，Llion Jones認(rèn)為，當(dāng)前的AI模型之所以存在局限性，是因?yàn)樗鼈儽辉O(shè)計(jì)成無(wú)法改變的結(jié)構(gòu)，這種結(jié)構(gòu)往往是脆弱的。
相比之下，發(fā)揮“集體智慧”的自然系統(tǒng)，對(duì)于周圍的變化非常敏感。基于此原理搭建的AI也會(huì)具有更好的安全性、更低的搭建成本。
等等，這不就是AI科學(xué)家嗎？
造出史上首個(gè)AI科學(xué)家、各項(xiàng)研究庫(kù)庫(kù)發(fā)
2024年8月，Sakana AI以造出首個(gè)“AI科學(xué)家”走紅一時(shí)。
他們推出了第一個(gè)用于自動(dòng)化科學(xué)研究和開(kāi)放式發(fā)現(xiàn)的綜合AI系統(tǒng)——The AI Scientist。
這個(gè)系統(tǒng)能夠一口氣自動(dòng)完成從提出研究想法、檢查創(chuàng)新性、設(shè)計(jì)實(shí)驗(yàn)、編寫(xiě)代碼，到在GPU上執(zhí)行實(shí)驗(yàn)并收集結(jié)果，最后完成論文撰寫(xiě)等全過(guò)程（一般會(huì)交由不同模型分工負(fù)責(zé)）。
而且當(dāng)時(shí)還放出了由它撰寫(xiě)的十篇完整學(xué)術(shù)論文，一時(shí)令無(wú)數(shù)網(wǎng)友驚嘆“是時(shí)候讓AI幫我們寫(xiě)論文了”。
p.s.:后來(lái)有研究員受其中一篇論文想法的啟發(fā)，還真的寫(xiě)出了一篇論文并在arXiv上公開(kāi)了~

實(shí)際上，The AI Scientist的出現(xiàn)并非偶然，而是Sakana AI對(duì)更早之前的一項(xiàng)研究的驗(yàn)證。
當(dāng)時(shí)他們想出了一個(gè)進(jìn)化合并模型的妙招——
把Huggingface上的現(xiàn)成模型拿來(lái)“攢一攢”，直接就能組合出新的強(qiáng)大模型。
具體來(lái)說(shuō)，他們受自然界的自然選擇啟發(fā)，引入“進(jìn)化模型合并”（Evolutionary Model Merge）的概念，提出一種可以發(fā)現(xiàn)最佳模型組合的通用方法。
采用相關(guān)方法，他們得到的一個(gè)70億參數(shù)的日語(yǔ)數(shù)學(xué)大模型，直接在相關(guān)基準(zhǔn)測(cè)試上取得了SOTA，打敗了700億參數(shù)的Llama-2等前輩。
而且關(guān)鍵是，得出這樣的模型不需要任何梯度訓(xùn)練，因此需要的計(jì)算資源大大減少。

基于此，他們后來(lái)在The AI Scientist研究里想到，是否能用大模型發(fā)現(xiàn)新的目標(biāo)函數(shù)來(lái)調(diào)整其他模型。
而這，正是“首位AI科學(xué)家”能夠成功運(yùn)行的根本原理。
再到后來(lái)，Sakana AI的AI科學(xué)家不斷進(jìn)化，其AI Scientist 2.0版本所生成的論文甚至通過(guò)了頂會(huì)ICLR workshop評(píng)審。
今年4月，Sakana AI向ICLR提交了三篇完全由AI Scientist v2生成的論文。（僅告知43篇評(píng)審論文中有3篇出自AI，但不告訴具體是哪一篇）。
結(jié)果，其中一篇論文《組合正則化：增強(qiáng)神經(jīng)網(wǎng)絡(luò)泛化的意外障礙》獲得了6/7/6評(píng)審分?jǐn)?shù)，超過(guò)平均人類接收門檻。

再之后，圍繞“AI協(xié)作”這一核心命題，Sakana AI基本以“一月一發(fā)”的快節(jié)奏推出多項(xiàng)研究：
今年5月，為考驗(yàn)大模型創(chuàng)造性推理能力，推出一個(gè)包含從簡(jiǎn)單4x4到復(fù)雜9x9現(xiàn)代數(shù)獨(dú)問(wèn)題的全新基準(zhǔn)Sudoku-Bench；6月，推出Text-to-LoRA （T2L），徹底簡(jiǎn)化了模型適配流程；同在6月，帶來(lái)旨在讓教師模型學(xué)會(huì)“啟發(fā)式”教學(xué)的新方法，使用新方法訓(xùn)練出的7B小模型，在傳授推理技能方面，比671B的DeepSeek-R1還要有效；7月，提出新算法AB-MCTS，能讓多個(gè)人工智能模型同時(shí)處理問(wèn)題；9月，開(kāi)源全新框架ShinkaEvolve，可以讓大模型在自己寫(xiě)代碼優(yōu)化自己的同時(shí)，還能同時(shí)兼顧效率；
至此，Sakana AI當(dāng)下能夠斬獲日本AI創(chuàng)企最高估值也就不難理解了——?jiǎng)?chuàng)始人自帶光環(huán)、AI科學(xué)家研究出圈、各種研究一月一發(fā)。
即使創(chuàng)始人無(wú)意再造一個(gè)日本版OpenAI，但就其估值和成長(zhǎng)軌跡而言，它已然是最接近“日本版OpenAI”的存在。

好好好，美國(guó)有OpenAI、日本有Sakana AI，那咱中國(guó)呢？
這里我們快速看一下國(guó)內(nèi)主要明星大模型公司的最新估值情況：
智譜AI，“AI六小虎”中首家啟動(dòng)IPO的企業(yè)，據(jù)中關(guān)村雜志9月報(bào)道其最新估值已超400億元RMB；
MiniMax，傳聞?dòng)?jì)劃今年赴港IPO，據(jù)晚點(diǎn)7月報(bào)道其投后估值超過(guò)40億美元（約284億人民幣）；
月之暗面，10月傳出數(shù)億美元新融資，若屬實(shí)估值有望突破33億美元（約234億人民幣）；
看來(lái)這股AI熱潮，已經(jīng)蔓延到了全球每一個(gè)角落（手動(dòng)狗頭）。

免責(zé)聲明：本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系我們，本站將會(huì)在24小時(shí)內(nèi)處理完畢。

同類資訊

人工智能公司MiniMax通過(guò)港交所聆訊

開(kāi)悟世界模型3.0發(fā)布，讓機(jī)器人“理解”物理世界規(guī)律并“預(yù)測(cè)”未來(lái)

不懂AI，晉升空間有限？中國(guó)人才勢(shì)能大會(huì)，兩類人才被密切關(guān)注

從網(wǎng)線到人生攻擊？項(xiàng)立剛批羅永浩 “干啥啥不成”，網(wǎng)友吵翻了

Intel顯卡沖擊高端：竟然要直接上32GB顯存！

一個(gè)人就是一支隊(duì)伍！上海首個(gè)人工智能廣告“一人公司”誕生！

全站最新

人工智能公司MiniMax通過(guò)港交所聆訊

開(kāi)悟世界模型3.0發(fā)布，讓機(jī)器人“理解”物理世界規(guī)律并“預(yù)測(cè)”未來(lái)

不懂AI，晉升空間有限？中國(guó)人才勢(shì)能大會(huì)，兩類人才被密切關(guān)注

從網(wǎng)線到人生攻擊？項(xiàng)立剛批羅永浩 “干啥啥不成”，網(wǎng)友吵翻了

熱門推薦

人工智能公司MiniMax通過(guò)港交所聆訊

開(kāi)悟世界模型3.0發(fā)布，讓機(jī)器人“理解”物理世界規(guī)律并“預(yù)測(cè)”未來(lái)

【西街觀察】硬科技上市驗(yàn)“真金”

不懂AI，晉升空間有限？中國(guó)人才勢(shì)能大會(huì)，兩類人才被密切關(guān)注

從網(wǎng)線到人生攻擊？項(xiàng)立剛批羅永浩 “干啥啥不成”，網(wǎng)友吵翻了

Intel顯卡沖擊高端：竟然要直接上32GB顯存！

一個(gè)人就是一支隊(duì)伍！上海首個(gè)人工智能廣告“一人公司”誕生！

電子產(chǎn)品信息清除強(qiáng)制國(guó)標(biāo)發(fā)布二手流通加上“安全鎖”

杭州外骨骼，斬獲大獎(jiǎng)！

月入過(guò)萬(wàn)、15天躺賺264萬(wàn)……專坑你爸媽！

從中試孵化邁向產(chǎn)業(yè)化，固態(tài)動(dòng)力電池技術(shù)成果在鹽城發(fā)布

又一家國(guó)產(chǎn)GPU企業(yè)，沖刺港股IPO！

手機(jī)套餐套路深：升易降難、區(qū)別對(duì)待，消費(fèi)者如何應(yīng)對(duì)？

MiniMax通過(guò)上市聆訊：持有現(xiàn)金超10億美元阿里米哈游騰訊加持

上海速度！成立不足四年，平均年齡29歲的AI公司，閃電沖擊港股上市