
“飛書想建立AI產品分級體系,它的底氣是什么?
2025年,AI幾乎無處不在。從智能助理到AI會議紀要,幾乎每一家To B軟件公司都在快速疊加AI能力,爭搶“AI+辦公”的未來入場券。對企業而言,仿佛不接入AI,就像還在用功能機時代的辦公系統。
但熱鬧背后,越來越多企業管理者陷入一種“AI疲勞”:許多AI功能看起來令人驚艷,真正上線使用后,卻不是響應緩慢、就是內容敷衍,甚至完全“答非所問”。AI產品成了企業的“PPT裝飾”,更像是為發布會準備的“賣家秀”,而非真正解決業務難題的“工具人”。
一句話,企業到底該如何判斷一個AI功能是“好看”還是“好用”?
就在這股技術與焦慮交織的洪流中,飛書在其2025年7月的發布會上,拋出一個頗具分量的新概念——AI應用成熟度模型。這是一套將企業AI應用劃分為四個成熟度等級的評價標準,試圖用清晰可量化的標準,把“AI好不好用”這件事,從主觀感知拉回理性評估。

M1–M4四個等級到底怎么分?
“AI應用成熟度模型”這一術語,聽起來略帶技術門檻,卻準確擊中了當前To B企業面臨的一大現實:AI到底該怎么評估?在產品頁面“寫得天花亂墜”、實操落地“一地雞毛”的今天,飛書嘗試用一套四級分類,把“能演示”和“能用”這道鴻溝,正式劃清。
四個等級,一眼看懂企業AI的“進化路徑”:

為了幫助大家更好理解模型,我們對其做了一些“翻譯”,并做了下面表格:

這四個階段的劃分邏輯,不是根據模型大小、算法復雜度,而是站在企業使用者視角:你能不能上線用?能不能持續用?用完有沒有實際業務提升?
與“科研AI”劃界,飛書想強調的是“落地工程性”。
傳統AI領域有很多技術評估維度,比如BLEU分數、推理速度、參數量等等,但對企業CIO或業務負責人來說,這些術語常常只是“玄學”。飛書模型的突破之處在于,它用非常貼近“業務落地感”的語言和等級,把AI的實用性顆粒度做了拆解。
換句話說,這是一個從產品視角出發的AI評估標準,不是技術人之間的炫技,而是業務人與工具之間的契約。
為什么企業AI需要“成熟度模型”?
AI正在從技術奇觀變成生產工具,但一個被忽視的問題是:我們拿什么來判斷一款AI產品,是否值得在企業中大規模部署?
在消費級市場,用戶靠“好不好玩”“用著爽不爽”來評估AI,而在企業級市場,沒有任何一個CIO會用“科技感”來作為選型依據。他們更在乎的是:能不能快速上線?能不能跟現有系統打通?用完之后,是錦上添花,還是雪上加霜?
然而現實是,大量企業AI產品還停留在“展示即結束”的階段。很多廠商為了追熱點,倉促將通用大模型能力包裹進現有產品,PPT上是“AI驅動”,真正使用時卻是:“問了三遍,還答非所問;總結了一頁,會后沒人敢用。”
這正是企業AI落地的“賣家秀–買家秀”悖論。
☆成熟度模型的意義在于:用一把“應用標尺”,重建信任
飛書提出M1–M4四級成熟度模型,其實在做一件至關重要的事:把企業對AI的期望值校準,把供應商對交付能力的承諾標準化。
從“只講模型參數”到“講清產品可用性”,這本質上是一次視角的轉變:
對企業用戶來說,成熟度模型讓他們可以設定合理預期,不再被“AI萬金油”式銷售術語蒙蔽;
對產品設計者來說,模型變成研發路線圖,知道什么是合格的交付標準;
對整個市場來說,這是一次從“無標可循”走向“共識定義”的進化。
飛書不是第一個嘗試分類模型的公司,但它的特別之處在于——這次不是實驗室發布的技術論文,而是一家實際運營AI產品的公司,站在一線,把模型與產品逐一綁定、現場驗證。
這讓這個模型的意義,不只是理論,更具有“工程實操價值”。
模型不是空談,
飛書用產品一一對標成熟度等級
相比空泛的概念模型,飛書更具說服力的一點在于,它同步公布了多款AI產品,飛書不是停留在“講模型”,而是用產品去定義模型、驗證模型。下面,我們來看幾個此次飛書發布的產品,并試圖將其與上面的AI應用成熟度模型對應起來。
☆M3標準:飛書知識問答——你的“企業豆包”
根據官方材料,飛書知識問答已達到M3級,即“成熟應用、可以大規模使用”。
無需企業構建知識庫,即可“開箱即用”;
能“穿透組織”,理解語境,提供基于企業內部信息的準確回答;
就像是一個理解公司全貌、能回答“企業問題”的“企業豆包”。
這意味著,知識問答具備跨部門、跨角色使用的穩定性,是一個可廣泛部署的AI“助手型”產品。
☆M4標準:飛書會議——實時總結的成熟AI
飛書會議達到M4標準,屬于“完全成熟,在適合的任何場景都可使用”的產品。該產品支持會中實時總結,而非僅在會后回顧;能自動生成紀要、輸出待辦事項,并通過文檔發送;準確率與邏輯概括能力“相當成熟”。
這表明飛書會議不僅能聽懂,還能“提煉”、“記錄”并“執行”后續任務,是典型的高成熟度AI產品形態。
此外,飛書還發布或升級了多個具備AI能力的產品,也在逐步靠近M3及以上標準。
☆多維表格:功能躍遷中的“王牌產品”
雖然飛書未明確將“多維表格”歸入成熟度模型等級,但從其產品更新幅度來看,它正向M3級靠近:月活接近千萬,標志其邁入成熟工具產品品類;支持“拖拉拽”搭建業務系統,兼顧美觀與實用;單表容量達1000萬熱行。
這使得多維表格不僅是表單工具,更開始具備“業務平臺”的潛質,對小微企業與大型流程管理者都構成實際可用價值。
此外,飛書還推出了AI開發套件,形成了更系統的企業AI能力框架。
?飛書妙搭(企業AI系統搭建工具)
該產品讓AI Coding快速落地產品思考,類比為“企業的無限產品經理和初階開發人員”,可自動輸出原型、生成系統。
?飛書Aily+aPaaS平臺
Aily為企業級Agent平臺,已在公牛集團、美中愛瑞等公司落地;aPaaS平臺實現AI加持的PaaS化開發,強調“效率、穩定、復用”的平衡
這些構成了飛書在更深層次的AI基礎設施布局,雖然未在材料中明確打標簽,但顯然是朝著高成熟度、高擴展性方向演進的產品組合。
AI的“L1-L5”時刻到了嗎?
飛書模型的行業意義與市場震動
自動駕駛行業早在數年前就確立了一套全行業通用的分級模型:L1到L5,定義了從人類輔助到完全無人駕駛的五個階段。這套模型并不僅僅是技術評估標準,它在根本上重新組織了整個產業鏈——幫助監管者判斷風險、幫助企業評估能力邊界,也幫助公眾建立對“自動化”的現實認知。可以說,沒有L模型,就沒有今天自動駕駛的理性競爭格局。
而飛書此次提出的“M1–M4 AI應用成熟度模型”,在本質上正是對企業AI落地路徑的一次結構化、工程化重構。這不僅是一個模型發布,更可能是“企業級AI”真正走向成熟產業階段的標志性事件。
☆模型之于產業,不是修辭,是基礎設施
飛書模型的提出,首先是一種對當下AI產品泛濫但落地稀缺現象的清算。在過去一年中,企業面對AI時,往往只能依賴“演示效果”和“銷售口徑”來判斷其價值,而非清晰的標準。飛書此次以“M3=成熟可用、M4=全面通用”的方式,給出了明確的能力刻度。這種能力刻度,不是技術參數維度的“token長度”或“訓練數據規模”,而是以“可大規模部署”和“適配多場景”的可用性為核心,強調真實環境下的穩定性、泛化能力與交付效果。
換句話說,它不問模型能不能生成“驚艷內容”,而是問:這個AI功能在公司里能不能頂得住實際使用?能不能連續跑?出錯率多高?
這正是To B場景下最需要的理性衡量方式。也正因如此,飛書模型與L模型之間產生了共振:它們都嘗試將“看不見的智能系統”拉入可以評估、可以管理、可以決策的框架之中,賦予市場真實的參考體系。
☆飛書想做的,是定義“可信AI”的使用上限
更深層次看,飛書通過這套模型的意圖并非只是幫助客戶選型,而是試圖建立企業AI應用的行業標準語法。在一個尚無權威機構給出通用評估體系的市場中,誰先給出一套被驗證、被采用的結構化標準,誰就擁有了定義未來的先手權。
從發布會披露的信息來看,飛書并不是“模型先行、產品隨后”,而是反其道而行之:用多個真實產品(知識問答、AI會議、多維表格等)作為標準“標桿”,反向映射出這一模型的四級結構。這種從底層產品能力抽象模型的路徑,比憑空建構模型更有操作性,也更容易贏得行業信任。
它背后折射的是飛書團隊對“工程視角AI”的理解——AI產品不是創意、不是賣相,而是一套能承載組織信任的生產工具。
☆企業級AI的下一階段,需要共識而非炫技
一個重要的判斷是:飛書這次的模型發布,將會引發AI工具廠商之間的“成熟度競賽”。就像自動駕駛廠商不能再用“我們很先進”一筆帶過L幾級一樣,未來AI產品也將無法僅憑一句“用了大模型”就獲得企業青睞。客戶會開始反問:你們是M幾?在哪些場景部署了?準確率多少?穩定性如何?
這對市場生態是一種積極的“清場效應”。它迫使廠商從“炫技”回到“交付”,從“拼參數”回到“拼耐用度”。
而這,正是一個行業走向真正成熟的開端。
你的AI,用到了第幾層?
AI正從“demo吸睛”走向“場景決勝”的階段。當越來越多的企業開始意識到:AI真正的價值不是能生成一段漂亮的文本、畫一幅驚艷的圖,而是能否在流程中持續穩定地產生價值時,我們其實已站在一個全新時代的門檻上。
飛書提出的“M1–M4 AI應用成熟度模型”可能不是完美的答案,但它的出現,至少為長期混沌不清的“企業AI落地標準”提供了一個結構化的起點。
這個模型的意義,不止在于幫助飛書解釋自己的產品,也不僅僅是一次品牌自證,更像是一面行業鏡子——它讓企業有機會回過頭來問自己:
我們現在用的AI功能,真的是在解決問題,還是只是在展示技術?
我們花了大量預算接入AI,它在日常的流程中真正發揮了多少作用?
我們是否有評估一款AI系統“好不好用”的標準,而不是“新不新鮮”的情緒?
在AI從“先鋒試驗”向“主流基礎設施”轉變的當下,這些問題值得每一個企業決策者、產品經理甚至一線員工思考。
如果你所在的企業,已經部署了多種AI應用,不妨回看一下你們的工具清單,用“M1–M4”的視角去做一場自測:哪些功能可以稱為成熟應用?又有哪些,其實還停留在“演示”階段?
而如果你是一個在思考AI產品設計或采購路徑的從業者,不妨把飛書這次的模型作為一個“起點模板”——未必非要照搬,但至少,它給出了一個可以被溝通、可以被質詢的語言系統。
企業AI的未來,屬于那些“最能穩定服務流程、最能交付真實價值”的系統。飛書這次邁出的是定義標準的第一步,接下來要回答的問題,將是:誰能持續站在M3與M4之上?誰能用產品把成熟度走成護城河?
你的AI,現在用到了第幾層?





京公網安備 11011402013531號