WAIC 世界人工智能大會展會上熙熙攘攘,格靈深瞳CEO吳一洲發現會場比往年更熱鬧,現場的人和產品的畫像更豐富,而且許多大公司展現出的AI單點應用深度也讓人印象深刻。AI應用真正走進產業的脈絡更為清晰了。
在鈦媒體2025 ITValue Summit前瞻WAIC現場版:AI落地指南系列的直播中,吳一洲與鈦媒體聯合創始人劉湘明聚焦視覺智能的進化和AI技術升級下的技術廠商展開對話。
格靈深瞳一直深耕視覺算法和多模態大模型技術研發,經歷過上一個技術時代的技術企業在這一波智能浪潮中有明顯不同的感受——產品有了“成長性”。吳一洲在對話中反復強調的一點是:要讓產品能用起來、用得好,而且有持續性的成長性。這不僅是格靈深瞳對產品的要求,也是作為技術廠商與客戶共創的愿景。
“以前,我們會給客戶一個通用工具,現在有了智能體Agent之后,變成了個性化、有記憶的工具,相當于一個搭檔、一個執行合伙人,應用上更細化、更成熟了。”吳一洲介紹說,經過近幾年的演進,格靈深瞳構建了由模型、算法、軟硬一體的產品和服務形成的端到端的體系。不過,她仍然非常理性,認為當前AI距離真正的落地應用、在行業里跟專家超融合一樣去深化應用,還有一段距離,這是在不斷與客戶共創的過程中得出的越發清晰的認知。
AI應用尚不成熟的局面,也給產品解決方案提供商帶來一個挑戰:過去按許可證(license)付費的邏輯,今天演變成了為效果、性能付費等等有待明確的標準。
“現在收費標準確實非常離散。現在主要面臨三重困境:一是定價標準缺失,服務價值缺乏行業基準;二是商業模式模糊,介于基礎設施、技術服務、產品工具以及咨詢服務之和;三是雙向預期偏差,客戶對效果認知不統一,供應商服務成熟度待驗證。這個問題本質是產業成熟度問題,需經歷服務定價的帕累托優化過程。”吳一洲坦言,這是供需雙方對最終把工具實際用起來、并且是可持續用起來,要付出的時間和成本預期能不能一致的認知問題。
AI時代變化不定,吳一洲更相信掌握技術的自主權,同時也保持與生態合作、互助互利的開放態度,在既有的金融、泛安防、政務、體育四大優勢領域繼續深耕。“硬件、數據采集以及持續優化、認知、服務、大規模部署、大規模算法升級、大規模調試的難點……”吳一洲坦言,“坑”其實是數不盡的,而且面向不同客戶、不同場景的“坑”其實不太一樣,“我們積累的經驗是在一些特定的行業、場景里深耕下去,盡量跟客戶一起少踩一些‘坑’,但其實沒有捷徑可走。”
附上本期直播時間軸,幫你快速跳轉感興趣的部分:
05:55 在賽道中跑出身位優勢的關鍵
09:13 那些年踩過的“坑”
21:42 如何讓能力基礎不同的客戶都跑起來?
28:34 市場、技術、客戶不斷變化,戰略重點如何調整?
31:39 技術要自主,但界限在哪里?
34:25 收費、交付的挑戰如何解決?
以下為對話實錄,經筆者整理:
劉湘明:大家好,歡迎來到《數字價值觀察室》在WAIC世界人工智能大會的現場。一洲,你這兩天在大會有什么感受,有什么發現,跟大家分享一下。
吳一洲:第一個感受還是火爆,而且是多方位的。以前是深度參與AI產業的人關注這個大會,現在有各種年齡、各種職業、各種產業里的人都涌向了這個大會。大家都在觀察有沒有新的事物、新的應用、新的思想。
第二,明顯感覺產品越來越豐富,更具象化了。從單純關注模型、智能體,到現在我們看到了具身智能、企業級應用、個人助理,以及端到端的產品,能感覺出來大家在AI的這片土壤里長出了很多新鮮的事物,也給我們帶來了很多的新想法。
我觀察了一些大廠的成果,像頭部科技企業展臺(如阿里巴巴、螞蟻集團)突破單純AI模型展示,深度融合云計算與大數據時代的技術積淀。其中螞蟻集團呈現的業務視角下的AI應用實踐,為行業深度集成提供了一些重要參考。國家電網展區是展示AI與核心業務的深度融合范例,其在分揀機器人等硬件設備中實現原生級創新,印證“專家型轉型”理念---即AI系統需與行業專家形成智能規劃與決策層面的深度協同。此外,消費級AI硬件展區(以具身智能、AI眼鏡為代表)直觀呈現大模型技術的生活化應用路徑,具有普適性示范價值。
劉湘明:回到主題,格靈深瞳一直在計算機視覺和大數據分析領域深耕了很多年。所以我也想請問一下,在這個賽道里面,現在跑出一些身位的優勢,你覺得關鍵是什么?
吳一洲:我們只能說在某一些具體的場景下是有優勢的,直白地說,現在談優勢還為時尚早。
我們是視覺、小模型CV算法起家,從2019年開始布局大模型,尤其是視覺大模型基座,這兩年我們也推出了自己的Glint-MVT視覺基礎模型。可以看到,我們其實一直在堅持布局AI視覺這部分,我們認為這是多模態以及人工智能應用中不可分割的一部分。AI不只有語言的部分,還有感知的部分,而且感知部分占比還是很高的。
在堅持這樣一個主賽道的情況下,我們做了很多產品,我覺得真正在場景中有優勢,還是要讓產品能用起來、用得好,而且持續性的有成長性。原來工具類的產品每一次升級是靠新版本發布,但AI自身有一種迭代能力,不是單純靠外界編程的。
在小模型時代,我們的迭代力是不夠的。現在我們替換了自己的大模型、以及很多生態合作伙伴一起擁抱了大模型基座之后,明顯能感受到冷啟動的能力,以及自身每一次發布新版基座模型的時候,上面的算法本質上有了一次新的演變,我們能感覺到它自己有成長性了,就像一個孩子一樣生長的力量。
可能談得上一些優勢的地方,是我們對于工程化、成本,以及過程中踩過的“坑”、怎么規避踩“坑”,還有對團隊的配置、對事物的理解,我覺得是有經驗的。
我們也構建了模型、算法、軟硬一體的產品、服務這么一套端到端的體系。但是離真正的深化應用、在行業里跟專家超融合一樣去深化應用,我覺得還是有一點進程的。
劉湘明:能不能跟大家分享一下踩了哪些“坑”?
吳一洲:抽象提煉來說,有以下幾點。
第一,硬件,在各種 GPU 上適配,是一個大家都面臨痛苦的點。第二,數據采集以及持續優化,不同的人標注能力不一樣,出來的結果不一樣。第三,認知,以前人們可能期待短期內達到測試結果,現在大家更關注如何系統性構建AI應用的體系,這個過程之中可能也會誕生新的“坑”,但至少大家對短期測試效果的追逐更理性了一些。第四,服務。以前信息化建設過程中,服務的“坑”是安裝部署實施,但現在的服務,更多的是專家跟客戶一起共同解決問題、共同成長,這個挺難的。而且,對于這樣一個服務的付費價格的認知也是不太一致的,客戶可能認為這是一個單純的售后服務,但其實不是,這樣的服務是決定產品能不能用好的最關鍵的點。
當然,我們還面臨大規模部署、大規模算法升級、大規模調試的難點……“坑”其實是數不盡的,而且不同客戶、不同場景的“坑”其實不太一樣。我們積累的經驗是在一些特定的行業、場景里深耕下去,盡量跟客戶一起少踩一些“坑”,但其實沒有捷徑可走。
劉湘明:這兩年的技術的升級,給格靈深瞳的業務和布局帶來哪些新的變化?
吳一洲:最大的變化其實還不在于我們自身,客戶的變化是最大的。這兩年,客戶對全面擁抱AI的熱忱是非常高昂的,帶來了很多暢想。
我們跟以前的自己相比,對待新事物(發展預期)更有耐心了。賽道上、行業上沒有大的變化,更多是從底座開始,在行業里去深化和多元化技術——從基礎的模型到硬件,如何更好地嵌入到客戶的業務流程使用中,如何讓客戶的個體化的使用感更強。以前,我們會給客戶一個通用工具,現在有了智能體Agent之后,工具變成了個性化、有記憶的,相當于一個搭檔、一個執行合伙人,應用上更細化、更成熟了。
第二個比較大的變化,我們以視覺起家,在擁抱當前非常明確的多模態趨勢時,也做了很多調整:第一,我們要吸納更多人才進來,現在的年輕人對大模型、智能體的接受程度、擁抱程度、熱忱是非常高的。我們的團隊在更加年輕化,我們也鼓勵大家抱有充分開放的心態,熱忱地擁抱各種各樣的技術,核心還是得嘗試。另外,對于我們做底層的同事們來說,他們一定要站在這個浪潮里面,當弄潮兒,不能過早地去評判。
所以,格靈深瞳既保持了在行業以及應用體系的穩定性和執著,同時也是更加開放。從人才、視覺技術、生態多維度,越來越廣泛,這兩年都是在以交朋友為主,建立朋友圈,也充分參與別人的朋友圈,充分地打開我們的開放性。
劉湘明:現在你們最重要的幾個場景是什么呢?
吳一洲:第一大場景還是在金融;接下來還有泛安防,也是我們始終會堅持的場景;第三,政務場景,尤其是涉及到高安全領域的政務場景,我們會做較細的深耕;我們還一直在體育訓練賽道持續地發布產品,保留在To C領域的觸達。
劉湘明:金融這些年的應用、需求有什么變化?
吳一洲:金融客戶對AI技術非常熱忱,他們應該是較早系統性布局數據中心(IDC)基礎設施,并在風控、營銷及安保等核心場景持續投入資源開展技術驗證的。當前大模型時代的關鍵轉變在于:客戶不再局限單一流程優化,而是提出更深層的跨領域融合需求。
例如,安保視頻分析數據自然賦能風控決策體系,這種協同效應突破了傳統信息化孤島模式。其本質變革源于底層技術架構的統一化:基于大模型與智能體構建的公共基座,使原本分散的部門數據資產(雖仍保持權屬獨立)在應用層面實現無縫貫通。相較于大數據時代依賴人工連接“煙囪系統”的刻意整合,新范式通過統一技術基座促成業務部門視角轉換——從關注系統建設歸屬轉向聚焦使用價值,最終形成更自然的跨域協同機制。
劉湘明:不同的行業和企業,數字化的基礎是差別非常大的,大模型的能力更是參差不齊。你們現在對能力基礎不同的客戶,怎么讓他們都能夠跑起來。
吳一洲:基礎不一致,可以用不同的方式解決。對于基礎非常好的客戶,比如金融銀行或者安防行業,很多時候客戶給我們帶來的啟發更大,因為我們陪伴客戶很多年了,會完全從客戶的業務視角、從規劃到落地的視角來去思考。很多時候,客戶已經開始跟我們討論更深層次的智能孿生、智能迭代的問題,比如,如何讓采集行為本身具備智能,從采集到分析、決策支持整個閉環過程具備智能,帶著規劃演進、迭代升級。
但是,對于一些數字化基礎較弱的行業或者客戶,好處是他們可以跳過很多不必要的迭代過程,直接進入智能時代。
但核心還是認知問題,對于最終把工具實際用起來,并且是可持續用起來,要付出的時間跟成本是什么樣子?本質在于大家對這個問題的預期能不能一致。
劉湘明:針對不同起點、不同基礎的客戶,你們的產品策略是什么樣的?
吳一洲:針對前瞻型客戶采用共創研發模式,將咨詢環節納入研發體系,重點突破行為數據與因果關系的采集瓶頸;面向入門級客戶則提供直效型標準化產品,通過最小化使用成本建立初步價值認知,分階段實現“可用→好用”的體驗演進。這種策略既滿足深度定制需求,也保障技術普惠可行性。
劉湘明:市場在變化,技術在變化,客戶也在變化,格靈深瞳的戰略重點會是什么樣的?
吳一洲:有幾個比較關鍵的要素。第一,技術跟進一定要牢牢地掌握在自己手里。所有技術的深入都是一塊硬骨頭,不管是我們自己的Glint- MVT視覺基礎模型,還是未來要發布的多模態大模型。很多人也在問我,為什么已經有很多多模態大模型的情況下你們還要做一個?首先,這個模型肯定是有格靈深瞳的特點,比如在視頻分析、垂直細分的工具、模型的精煉上一定是有我們自己特點的;第二,要跟進這個開放的時代,要知道怎么用、怎么去解決問題。“改一改就用了”跟“深入地自己完整走一遍這個過程”,帶來的認知是不一樣的,我們會走得非常扎實。相關工具也會慢慢多元化起來,而且我們會全面地開放給客戶、開放給生態,互利互助。
第二,在前面提到的四個行業,已經足夠我們端到端深耕了。把任何一個行業做好,都是非常非常難的。在我設想中,再過幾年,在格靈深瞳的前端行業里,可能行業專家本身所占的比例會大幅度提升,并不是單純使用AI能力的專家。不過,距離我們跟客戶在行業里真正感知和用好技術,我覺得還有一段時間。
劉湘明:你剛才說了一個特別好的點,就是技術的跟進,怎么把技術掌握在自己手里邊。但其實每個人理解的技術是不一樣,這個界限你是劃在哪?哪些是留給自己去做的,哪些可能合作伙伴去做,哪些可能是要那些大廠花上百億去干的事情?
吳一洲:現在格局已經越來越明顯了,決策框架基于三要素評估:資金規模、人才儲備、時間成本。其實我們做視覺大模型也是跟大廠充分建立生態、互利互助的;第二,我們把自己最擅長的技術拿出來給大家用,比如今年下半年計劃發布的視覺基礎模型Glint- MVT的新版本,在視頻分析處理和理解上(性能)比較好,因為我們在視頻領域是要扎深的,這是主線;其他的,我覺得都是要靠生態,因為現在進入到深水區,每一件事情所要付出的成本以及實現難度都超乎想象。
劉湘明:如果按性能效果收費,交付的挑戰因素有哪些?如何解決?
吳一洲:現在收費標準確實非常離散。現在主要面臨三重困境:一是定價標準缺失,服務價值缺乏行業基準;二是商業模式模糊,介于基礎設施服務與咨詢公司形態之和;三是雙向預期偏差,客戶對效果認知不統一,供應商服務成熟度待驗證。這個問題本質是產業成熟度問題,需經歷服務定價的帕累托優化過程。
劉湘明:客戶在AI落地時最緊迫、最重要的問題是什么?
吳一洲:關鍵痛點集中于兩大維度:一是人才瓶頸維度,缺乏兼具決策能力與落地經驗的復合型人才,理想狀態是業務專家與AI專家的“雙重屬性融合”體現在同一個人身上;二是目標管理維度,對AI的預期目標多元且時效要求高,但落地過程中受到成本約束等因素影響,容易導致實際效果的波動,所以需要更聚焦、更純粹地理解和解決項目的本質問題。根本解決方案在于培育AI原生思維,使技術應用成為業務決策的本能組成部分。
劉湘明:謝謝一洲,特別坦率而且非常有洞見的分享。
![]()
9月11日-14日由鈦媒體集團、ITValue聯合主辦的2025 ITValue Summit 數字價值年會將以「AI落地場景真相」為主題,與新老朋友重聚三亞,并在全年圍繞1場年度演講,5大ToB明星IP持續內容“造血”,設計N個場景的想象空間,打造1本《AI落地場景指南》,一同解決AI實際落地應用背后的“10大問題”,探索數字經濟時代的變革和機遇。(點擊進入了解更多大會報名信息)評!加入創新場景50榜單評選 2025年度「創新場景 TOP 50」榜單評選征集啟動 申報日期:即日起~8月22日止 公開投票及專家評審:2025年8月23日起~8月31日止 申報鏈接:https://m.tmtpost.com/post/cj50(請使用PC端申報,暫不支持手機端)





京公網安備 11011402013531號