剛剛,創(chuàng)下日本估值新高的AI初創(chuàng)公司誕生了!
它就是Sakana AI,由Transformer論文八子之一創(chuàng)辦,老黃的英偉達(dá)也投了。
![]()
幫大家快速回憶一下,這家公司其實(shí)就是史上首位“AI科學(xué)家”背后的出品方——
當(dāng)時(shí)他們發(fā)布的The AI Scientist,一登場(chǎng)就一口氣生成了十篇完整學(xué)術(shù)論文,而且每篇成本才15美元左右(約107.62元),一時(shí)吸引大量關(guān)注。
![]()
根據(jù)Sakana AI公告,最新B輪融資籌集了200億日元(約合1.35億美元、9億多人民幣),總估值來(lái)到約4000億日元(約合26.35億美元、184億人民幣),創(chuàng)下日本非上市初創(chuàng)企業(yè)的估值紀(jì)錄。
而且它的投資方陣容也堪稱豪華——除英偉達(dá)(參與A輪)之外,還有一眾美國(guó)頂級(jí)風(fēng)投(如Khosla Ventures、NEA)和日本產(chǎn)業(yè)與金融巨頭(如三菱日聯(lián)、四國(guó)電力)等。
所以,Sakana AI為什么能獲得如此高估值?
Transformer八子之一創(chuàng)辦、要做基于自然啟發(fā)的AI模型
Sakana AI成立于2023年7月,至今不過(guò)短短兩年。
之所以一開(kāi)始就受到巨大關(guān)注,毫無(wú)疑問(wèn)離不開(kāi)它的兩位明星創(chuàng)始人。
聯(lián)創(chuàng)兼CTO Llion Jones,大名鼎鼎的Transformer論文8位作者之一。
![]()
他本碩畢業(yè)于伯明翰大學(xué),在Delcam、油管、谷歌都工作過(guò),創(chuàng)辦Sakana AI之前在谷歌工作了8年之久。
據(jù)FourWeekMBA介紹稱,在他之前的工作經(jīng)歷中,“曾兩度與谷歌的工作擦肩而過(guò)”。
第一次是他剛畢業(yè)找工作時(shí),雖然投了谷歌倫敦軟件工程師的簡(jiǎn)歷,并通過(guò)了兩輪電話面試,但最終相比谷歌,他選擇了位于英國(guó)的CAD/CAM軟件公司Delcam。
第二次是工作18個(gè)月后,他又接到了谷歌的招聘電話,詢問(wèn)他是否想重新申請(qǐng),但他依舊沒(méi)去谷歌,而是隨后加入了YouTube。
在Youtube做軟件工程師的三年期間,他對(duì)人工智能產(chǎn)生興趣,于是自學(xué)了Coursera的機(jī)器學(xué)習(xí)課程,并終于在2015年的時(shí)候加入谷歌研究院,擔(dān)任里面的高級(jí)軟件工程師。
也正是在此期間,他與其他七名作者一起發(fā)表了那篇著名的Transformer論文《Attention Is All You Need》。
![]()
而之所以選擇離開(kāi)谷歌,是因?yàn)楣灸壳耙呀?jīng)發(fā)展到一定規(guī)模,使得他無(wú)法繼續(xù)進(jìn)行自己想做的工作。
按他自己的話來(lái)說(shuō)就是,谷歌確實(shí)讓他有種“被困住的感覺(jué)”。
于是瀟灑一轉(zhuǎn)身,他選擇聯(lián)合另一位谷歌前員工開(kāi)始創(chuàng)業(yè),而這位谷歌前員工就是如今身為Sakana AI聯(lián)創(chuàng)兼CEO的David Ha。
David Ha(右圖)曾是谷歌大腦的高級(jí)科學(xué)家,也曾領(lǐng)導(dǎo)過(guò)圖像生成模型獨(dú)角獸公司Stability AI的研究部門。
今年8月,他還入選了《時(shí)代》雜志評(píng)選的2025年人工智能領(lǐng)域百大人物榜單。
![]()
有了這二人,base東京的Sakana AI可謂自帶光環(huán)。
(注:之所以選擇東京,是因?yàn)楸泵滥沁叺纳墒紸I研究人員競(jìng)爭(zhēng)非常激烈(手動(dòng)狗頭),而在日本這邊競(jìng)爭(zhēng)相對(duì)小一點(diǎn)而且也不乏高質(zhì)量AI人才。)
而且比較新奇的是,Sakana AI并不是要在日本再造一個(gè)OpenAI或Anthropic,而是一開(kāi)始就要走一條“不一樣的路”——
他們希望放棄Transformer架構(gòu),并從自然進(jìn)化中汲取靈感,以降低模型的計(jì)算成本并提升其性能 。
概括而言,他們的想法可以基本歸納為:
1)日本是個(gè)資源有限的國(guó)家,AI發(fā)展到后面肯定會(huì)受到電力等資源的限制,所以從一開(kāi)始就要考慮如何提效;
2)通過(guò)從自然進(jìn)化中汲取靈感,他們能夠?qū)崿F(xiàn)這一目的。
至于究竟是怎樣的自然靈感,這可以從他們給公司起的名字“Sakana AI”(sakana是日語(yǔ)“魚(yú)”(さかな)的羅馬讀音)一窺。
![]()
就像大自然中的魚(yú)會(huì)基于某種簡(jiǎn)單的規(guī)則成群活動(dòng)。因此,AI們也能借鑒它們的思想,無(wú)需更大的體積就能完成很復(fù)雜的任務(wù)。
具體來(lái)說(shuō),Sakana AI計(jì)劃開(kāi)發(fā)一種基于自然啟發(fā)智能(nature-inspired intelligence)的基礎(chǔ)模型,借鑒自然領(lǐng)域中的“進(jìn)化”和“集體智慧”思想,讓一群AI協(xié)作,類似于當(dāng)前AI領(lǐng)域的生物啟發(fā)計(jì)算方向。
據(jù)《金融時(shí)報(bào)》介紹稱,Llion Jones認(rèn)為,當(dāng)前的AI模型之所以存在局限性,是因?yàn)樗鼈儽辉O(shè)計(jì)成無(wú)法改變的結(jié)構(gòu),這種結(jié)構(gòu)往往是脆弱的。
相比之下,發(fā)揮“集體智慧”的自然系統(tǒng),對(duì)于周圍的變化非常敏感。基于此原理搭建的AI也會(huì)具有更好的安全性、更低的搭建成本。
等等,這不就是AI科學(xué)家嗎?
造出史上首個(gè)AI科學(xué)家、各項(xiàng)研究庫(kù)庫(kù)發(fā)
2024年8月,Sakana AI以造出首個(gè)“AI科學(xué)家”走紅一時(shí)。
他們推出了第一個(gè)用于自動(dòng)化科學(xué)研究和開(kāi)放式發(fā)現(xiàn)的綜合AI系統(tǒng)——The AI Scientist。
這個(gè)系統(tǒng)能夠一口氣自動(dòng)完成從提出研究想法、檢查創(chuàng)新性、設(shè)計(jì)實(shí)驗(yàn)、編寫(xiě)代碼,到在GPU上執(zhí)行實(shí)驗(yàn)并收集結(jié)果,最后完成論文撰寫(xiě)等全過(guò)程(一般會(huì)交由不同模型分工負(fù)責(zé))。
而且當(dāng)時(shí)還放出了由它撰寫(xiě)的十篇完整學(xué)術(shù)論文,一時(shí)令無(wú)數(shù)網(wǎng)友驚嘆“是時(shí)候讓AI幫我們寫(xiě)論文了”。
p.s.:后來(lái)有研究員受其中一篇論文想法的啟發(fā),還真的寫(xiě)出了一篇論文并在arXiv上公開(kāi)了~
![]()
實(shí)際上,The AI Scientist的出現(xiàn)并非偶然,而是Sakana AI對(duì)更早之前的一項(xiàng)研究的驗(yàn)證。
當(dāng)時(shí)他們想出了一個(gè)進(jìn)化合并模型的妙招——
把Huggingface上的現(xiàn)成模型拿來(lái)“攢一攢”,直接就能組合出新的強(qiáng)大模型。
具體來(lái)說(shuō),他們受自然界的自然選擇啟發(fā),引入“進(jìn)化模型合并”(Evolutionary Model Merge)的概念,提出一種可以發(fā)現(xiàn)最佳模型組合的通用方法。
采用相關(guān)方法,他們得到的一個(gè)70億參數(shù)的日語(yǔ)數(shù)學(xué)大模型,直接在相關(guān)基準(zhǔn)測(cè)試上取得了SOTA,打敗了700億參數(shù)的Llama-2等前輩。
而且關(guān)鍵是,得出這樣的模型不需要任何梯度訓(xùn)練,因此需要的計(jì)算資源大大減少。
![]()
基于此,他們后來(lái)在The AI Scientist研究里想到,是否能用大模型發(fā)現(xiàn)新的目標(biāo)函數(shù)來(lái)調(diào)整其他模型。
而這,正是“首位AI科學(xué)家”能夠成功運(yùn)行的根本原理。
再到后來(lái),Sakana AI的AI科學(xué)家不斷進(jìn)化,其AI Scientist 2.0版本所生成的論文甚至通過(guò)了頂會(huì)ICLR workshop評(píng)審。
今年4月,Sakana AI向ICLR提交了三篇完全由AI Scientist v2生成的論文。(僅告知43篇評(píng)審論文中有3篇出自AI,但不告訴具體是哪一篇)。
結(jié)果,其中一篇論文《組合正則化:增強(qiáng)神經(jīng)網(wǎng)絡(luò)泛化的意外障礙》獲得了6/7/6評(píng)審分?jǐn)?shù),超過(guò)平均人類接收門檻。
![]()
再之后,圍繞“AI協(xié)作”這一核心命題,Sakana AI基本以“一月一發(fā)”的快節(jié)奏推出多項(xiàng)研究:
今年5月,為考驗(yàn)大模型創(chuàng)造性推理能力,推出一個(gè)包含從簡(jiǎn)單4x4到復(fù)雜9x9現(xiàn)代數(shù)獨(dú)問(wèn)題的全新基準(zhǔn)Sudoku-Bench;6月,推出Text-to-LoRA (T2L),徹底簡(jiǎn)化了模型適配流程;同在6月,帶來(lái)旨在讓教師模型學(xué)會(huì)“啟發(fā)式”教學(xué)的新方法,使用新方法訓(xùn)練出的7B小模型,在傳授推理技能方面,比671B的DeepSeek-R1還要有效;7月,提出新算法AB-MCTS,能讓多個(gè)人工智能模型同時(shí)處理問(wèn)題;9月,開(kāi)源全新框架ShinkaEvolve,可以讓大模型在自己寫(xiě)代碼優(yōu)化自己的同時(shí),還能同時(shí)兼顧效率;
至此,Sakana AI當(dāng)下能夠斬獲日本AI創(chuàng)企最高估值也就不難理解了——?jiǎng)?chuàng)始人自帶光環(huán)、AI科學(xué)家研究出圈、各種研究一月一發(fā)。
即使創(chuàng)始人無(wú)意再造一個(gè)日本版OpenAI,但就其估值和成長(zhǎng)軌跡而言,它已然是最接近“日本版OpenAI”的存在。
![]()
好好好,美國(guó)有OpenAI、日本有Sakana AI,那咱中國(guó)呢?
這里我們快速看一下國(guó)內(nèi)主要明星大模型公司的最新估值情況:
智譜AI,“AI六小虎”中首家啟動(dòng)IPO的企業(yè),據(jù)中關(guān)村雜志9月報(bào)道其最新估值已超400億元RMB;
MiniMax,傳聞?dòng)?jì)劃今年赴港IPO,據(jù)晚點(diǎn)7月報(bào)道其投后估值超過(guò)40億美元(約284億人民幣);
月之暗面,10月傳出數(shù)億美元新融資,若屬實(shí)估值有望突破33億美元(約234億人民幣);
看來(lái)這股AI熱潮,已經(jīng)蔓延到了全球每一個(gè)角落(手動(dòng)狗頭)。





京公網(wǎng)安備 11011402013531號(hào)