智通財經APP獲悉,申萬宏源發布研報稱,AI Infra作為AI模型訓練與推理的底層支撐,已成為應用落地的關鍵 “賣鏟人”。算力調度是決定模型推理盈利水平的核心變量,國內模型Token收費顯著低于海外,成本敏感度更高。據測算,在單日10億查詢量下,若使用H800芯片,單卡吞吐能力每提升10%,毛利率能夠提升2-7個百分點。生成式AI+Agent加速滲透,AI infra軟件作為應用部署的基礎設施,有望進入高速增長期。看好高實時性、可靈活拓展的分布式交易型數據庫廠商(OLTP),以及增量的向量數據庫。
申萬宏源主要觀點如下:
算力調度是決定模型推理盈利水平的核心變量
國內模型Token收費顯著低于海外,成本敏感度更高。阿里Aegaeon通過Token級調度可減少82% GPU用量,華為Flex:ai提升30% 算力利用率,高效調度能力成為模型推理廠商盈利關鍵。根據申萬宏源測算,在單日10億查詢量下,若使用H800芯片,單卡吞吐能力每提升10%,毛利率能夠提升2-7個百分點。
數據類Infra需求先于應用爆發,向量數據庫成剛需
RAG技術滲透率快速提升,Gartner預測2025年企業采用率將達68%。向量數據庫作為RAG核心組件,支撐海量數據毫秒級檢索,市場需求持續高增。
AI時代數據架構從“分析優先”轉向“實時運營+分析協同”,行業發生了幾點重要的變化:1)NoSQL+OLTP數據庫再風靡,通過補充向量索引能力切入向量數據庫市場;2)數據湖、數據倉庫廠商(OLAP為主)通過并購、合作方式引入AI模型,向全棧工具邁進。
MongoDB憑借 “低門檻 + 高彈性”,契合中小客戶低成本AI落地需求,增長彈性突出。MongoDB作為文檔型NoSQL數據庫,其適配非結構化數據存儲與高頻實時CRUD操作,契合AI原生應用與Agent需求,2025年收購Voyage AI補齊向量檢索能力。FY26Q3核心產品實現30%增速,增長彈性突出。
Snowflake與Databricks靠全流程工具鏈和客戶粘性,占據數據密集型行業核心場景,但需應對CSP跨界競爭與實時能力短板。Snowflake與Databricks以OLAP為核心向全棧工具延伸,靠海量數據處理能力成為中大型企業首選,但TP能力暫有不足(尤其是Snowflake),面臨中小市場滲透與云廠商擠壓壓力。
GPU主導數據控制中心,存儲與數據庫技術升級
NVIDIA推出SCADA方案實現GPU直連SSD,將IO延遲降至微秒級。向量數據庫需適配GPU并行計算,通過列式存儲、算子重寫等技術升級,匹配AI實時推理需求。
相關標的
MongoDB(MDB.US)、達夢數據(688692.SH)、英方軟件(688435.SH)、Snowflake(SNOW.US)、深信服(300454.SZ)等。
風險提示
商業化與IT支出不及預期;生態競爭加劇風險,云廠商自研與平臺整合擠壓份額;技術迭代與產品成熟度風險。





京公網安備 11011402013531號