周末的上海世博展覽館,人頭攢動。2025世界人工智能大會(下稱“WAIC 2025”)正在進行中,在H1、H2、H3館,騰訊、阿里、華為等科技巨頭,三大運營商,AI六小龍,汽車大廠,具身智能軍團……這些大公司和明星企業的展臺內外依舊人聲鼎沸。
與此同時,位于B2層的H4館某個不起眼的展臺周邊,卻也長時間圍滿了人,吸引了眾多采購團組和產業鏈合作方的關注。在這片面向初創企業、投資機構的“創新社交場”,下一個宇樹科技、DeepSeek或許正在醞釀中。
在WAIC 2025期間,記者在H4館與專注于視覺大模型領域的上海諦視萬象科技有限公司(下稱“諦視萬象”)聯合創始人兼副總裁閆明進行了一場對話。
諦視萬象是一家成立僅一年多的初創企業,專注智慧視覺全場景服務。公司核心產品諦視多模態視覺大模型平臺,憑借領先的視覺多模態技術和全生態融合,在業內率先實現“任意算法分鐘級創建、小時級上線、無需標注訓練”,同時賦能黨政、交通、公共安全、能源、水利、家庭等眾多領域客戶,助力構建智能公共安全屏障,加速業務流程智效革新,驅動行業智能化深度轉型,實現安全保障能力躍升與運營效率質的飛躍。
閆明在采訪中向記者表示,上一輪互聯網浪潮打破了信息壁壘,帶來了信息平權,新一輪的人工智能打破的是知識壁壘,實現知識平權。在他看來,每個時代的人都有自己的使命,對于信息化從業多年的IT老兵來講,新的科技革命賦予了我們這代人新的使命,讓我們中國的IT企業能夠在這一波科技浪潮中不再落后于美西方,開啟一個屬于人工智能的全新時代,這也是團隊創業的初心。
![]()
“新公司”與“IT老兵”
企查查官網顯示,上海諦視萬象科技有限公司成立于2024年5月,至今還不到一年半的時間。2024年9月,諦視萬象進行了“諦視安防多模態視覺大模型軟件”著作權登記;在WAIC 2025前夕,該公司密集登記了諦視萬象智慧電力視覺大模型應用平臺、諦視萬象智慧應急視覺大模型應用平臺、諦視萬象智能體MCP引擎系統、諦視萬象視覺大模型算法引擎系統、諦視萬象視覺大模型算法集群調度引擎系統等著作權。從這些軟件名稱不難發現,這是一家專注于視覺多模態大模型的科技公司。
“我們是一個新公司,老團隊。”閆明在介紹公司時用到了這兩個詞,雖然諦視萬象是一家初創企業,但團隊成員均來自上市公司從業10年以上的核心骨干。
對于創業的初衷,閆明提到了兩點,一方面是團隊看到了人工智能浪潮的機會,商業邏輯是能夠跑通的;另一方面,團隊認為視覺智能不僅能夠帶來商業價值,還能解決很多社會問題。
他向記者介紹,一個完整的視覺任務流程,需要客戶準備圖片、標注、訓練、運行調試、再校準,反反復復周期很長,投入的時間和人力也很多,原先可能需要3—6個月,客戶要提供很多圖片才能實現一個算法,現在通過諦視萬象多模態大模型,人機對話一句話就能生成一個算法,不需要提供任何圖片標注訓練。
“比如在人工智能大會上,想知道哪里有人摔倒,有沒有未成年人無人陪伴,有沒有人員異常擁擠等等,算法都能任意生成,不局限于給定圖片才能識別的場景。”閆明稱,“這個技術給行業和社會帶來變革,我們能預感到,在未來3—5年來看,這個方向一定是未來。從社會整個效率提升來講,它確實是改變了現在整個商業模式。”
諦視萬象聚焦的智慧視覺領域也是一個充滿著前景和機遇的龐大市場,閆明表示,在城市治理、安全生產、檢測等領域,國內有大量攝像頭,而且建設周期不同,用戶需要一種在不更換攝像頭的情況下也能使用算法和執行任務的方案。“這個市場非常龐大,我們評估大概是過萬億,而且通過我們的商業模式來看,客戶愿意接受通過人工智能多模態大模型的方式,把現有的海量攝像頭重新激活,客戶愿意付費來買單。”
![]()
科技平權,“大模型小型化”
除了諦視多模態視覺大模型平臺,在WAIC 2025期間,諦視萬象還重點展示了視覺大模型一體機,這是一款集成了前沿人工智能視覺大模型平臺與高性能計算硬件的一站式智能設備,專為復雜場景下的視覺任務設計。
該產品以視覺感知能力為核心,融合前沿科技,為公共安全、交通運輸、城市管理、應急管理、水利、智能制造等各領域的視覺分析場景賦智,優勢在于分鐘級算法創建、小時級部署上線、零樣本訓練、軟硬一體化設計。
![]()
介紹這款視覺大模型一體機時,閆明表示,在視覺領域,傳統硬件公司更常見的策略是綁定客戶,把算法和硬件做耦合,這會導致更新算法時需要更換更高級的硬件,因此會帶來更大的投入成本,“但對我們來說,前端的算法和硬件要解耦,而且算法對客戶要平權。”他表示,無論是國家部委、省廳、市局,還是基層派出所、街道辦,都能享受到科技帶來的變化。
閆明提到了“科技平權”這一說法,“小到插幾張消費級顯卡就能運作,我們叫‘大模型小型化’。我們去年6月就用大模型小型化的方式,實現讓一臺服務器撐起模型加載和任務執行。”
不過,這并不意味著諦視萬象主要服務中小規模的客戶,“我們想打通的邏輯是:不是只能服務某一類客戶。我們的理念是,大模型用MOE方式,彈性的方式,大客戶可以用多設備集群,中小客戶用單一設備或幾臺設備集群就能實現,在功能上完全是平權的。”閆明說。
諦視萬象想要探索的模式是:同時服務大、中、小型客戶,通過服務大型客戶來驗證產品的穩定性和先進性,服務中小客戶來驗證產品的成本控制能力。
閆明在采訪中向記者強調了諦視萬象的自研能力,由于公司面向B端和G端客戶,套殼模型無法適配新的國產化要求,“我們整套模型底層是自研的,不過最底層架構和國外是平級的,用了Transformer架構,畢竟這一輪大模型基本都以Transformer架構為底層。但模型的素材訓練、架構設計等,都是我們自主開發的,這也是我們的一大優勢。”
如何實現商業閉環,成為視覺領域下一個DeepSeek
近年來,AI大模型領域掀起了新一輪融資競賽,各路資本主動入局。
雖然多家資本公司在接觸諦視萬象,但閆明透露,公司目前還沒有進行過融資,所有的投入均來自團隊自身,但商業模式已經打通,且已經實現了盈利。
“一個模型好不好,關鍵看客戶愿不愿意付錢,能不能滿足他們的痛點。客戶形成了口碑,A客戶會推薦給B客戶,B客戶推薦給C客戶,在圈子里橫向傳播。”閆明向記者表示,諦視萬象目前已經服務了七個省廳、二十多個市局的公安系統;在應急領域,諦視萬象參與了行業標準的撰寫;在企業端,公司也已經服務了包括央國企在內的很多客戶。
閆明認為,相比傳統大模型,在當前的行業競爭中,能否看到產品的商業變現價值是關鍵,“我們的產品主打的是一定能實現商業變現、商業落地、產業閉環,以此為起點做開發,完全針對市場和客戶需求。所以我們通過工程優化降低成本,和DeepSeek的路線一致。去年6月把大模型小型化,本質上也是為了降低客戶使用成本,讓客戶用得起、用得好。”他表示。
據閆明闡述,只有產品足夠領先,能持續帶來好體驗,同時成本降下來,才能形成商業閉環,“否則做一兩個標桿客戶其實意義不大,但是能服務幾十個、幾百個甚至更多個客戶時,怎么還能保證服務體驗好且成本低,才是商業閉環的本質。”他表示,諦視萬象通過標準化模型,讓客戶能任意使用算法,不需要客戶提供圖片和素材,從根本上改變了行業成本構成。
![]()
目前諦視萬象團隊成員集中在研發和服務,公司沒有一個銷售,而實現商業閉環的背后,除了自身產品和技術能力領先,閆明表示離不開上海市政府的支持,“上海市政府尤其是徐匯區政府給了我們很大的支持。他們幫助我們企業推薦了很多政府的客戶,一方面是把人工智能技術進行了展示,另一方面又幫我們對接多種場景的需求,在中間做供需調配和牽線搭橋。這一點對于我們人工智能企業來講非常好。因為我可以用很低的成本來做嘗試,去試錯,去獲得很多建議來修改我的產品,政府幫助我們降低了非常多的市場端投入。”
作為人工智能領域從業者,閆明對視覺智能這一賽道和諦視萬象自身都充滿信心,他認為這一賽道在未來一定能夠誕生一家偉大的航母級別的公司,“這個市場是足夠撐起這個公司的,但是我們有沒有可能成為那家(公司),我覺得我們正在朝著那個方向努力,我希望我們有幸能成為那一家。對于未來我們充滿了信心。”





京公網安備 11011402013531號