國(guó)際頂級(jí)期刊《自然》雜志將梁文鋒評(píng)為2025“Nature’s 10”之一,因?yàn)樗退墓?DeepSeek 通過推出 R1 推理大模型,對(duì)全球人工智能格局產(chǎn)生了巨大沖擊
具體獲評(píng)原因:
2025 年 1 月,DeepSeek 突然發(fā)布性能強(qiáng)、成本卻極低的 R1 模型,震撼全球。它不僅在數(shù)學(xué)、編程等復(fù)雜任務(wù)上表現(xiàn)出色,還率先開放模型權(quán)重,讓全球研究者免費(fèi)獲取和改造,推動(dòng)了中美更多公司跟進(jìn)開放模式。其訓(xùn)練成本遠(yuǎn)低于美國(guó)公司,如 meta 的 Llama 3 405B 成本是其 10 倍以上。
更重要的是,DeepSeek 在 9 月公開了 R1 的完整訓(xùn)練細(xì)節(jié),使其成為首個(gè)通過同行評(píng)審的大型推理模型,為行業(yè)提供了清晰可復(fù)制的訓(xùn)練范式,被認(rèn)為“教會(huì)了世界如何訓(xùn)練推理模型”。
梁文鋒出身廣東農(nóng)村,本科碩士就讀浙江大學(xué),早年熱衷開發(fā)視頻追蹤算法,后來轉(zhuǎn)向金融,并于 2023 年利用自己積累的資金創(chuàng)辦 DeepSeek。他提前十年大量購(gòu)買 NVIDIA GPU,為之后的模型突破奠定基礎(chǔ)。
DeepSeek 的企業(yè)文化強(qiáng)調(diào)潛力和扁平化管理,甚至有中學(xué)生成為 R1 論文作者。公司堅(jiān)持解決基礎(chǔ)難題而非商業(yè)化優(yōu)先,這在行業(yè)內(nèi)獲得高度評(píng)價(jià)。
在中國(guó),DeepSeek 模型已滲透日常生活,從政府熱線到微信生態(tài),用戶規(guī)模達(dá)數(shù)千萬。它也被視為中國(guó)從模仿者向創(chuàng)新者轉(zhuǎn)變的象征。
外界正關(guān)注 DeepSeek 下一代推理模型 R2,盡管因硬件與數(shù)據(jù)問題被傳延遲,但團(tuán)隊(duì)強(qiáng)調(diào)將繼續(xù)堅(jiān)持開源路線
![]()
![]()





京公網(wǎng)安備 11011402013531號(hào)