11月18日,2025 Oceanbase年度發布會在北京召開。
作為官宣“DataxAI”后的第一年,Oceanbase在這次大會上集中釋放了他們對于AI原生數據庫的思考,以及面向AI的一系列技術和產品。
我們在現場看到了Oceanbase首個一體化融合版本4.4版本的正式發布,以及面向AI的seekdb數據庫的發布,與此同時,我們也看到了基于混合搜索的PowerRAG智能文檔解析框架、PowerMem分層記憶架構的開源。
Oceanbase CTO楊傳輝說,“數據庫領域技術范式已經從原來應用服務,慢慢延伸到AI服務,這其中,混合搜索正在成為AI原生數據庫的‘分水嶺’。”
Oceanbase CEO楊冰說,“AI時代,讓我們離‘世界級數據庫’的夢想更近了一些。”
![]()
01 正確性很重要
作為Oceanbase的十五周年年度發布會,今年的發布會有些不同。
我們在現場看到,在上午的主論壇上,Oceanbase這次是率先將客戶請上了臺,分別由高德地圖、平安人壽、愛奇藝、中國聯通等各領域代表分享他們的數據庫應用歷路、數智化轉型經歷,以及Oceanbase為這些企業在業務上帶來的變化。
以如今火爆的視頻行業為例,每部視頻上線都會經歷立項、預算、宣發、拍攝、生產、編解碼運營、上線,以及在線售賣這樣復雜的過程,以往長視頻時代,一年會有上百部視頻上線,而隨著短視頻的興起,每年上線的視頻數量從上百部一直飆升到了上萬部。
為了支撐如此龐大的新業務需求,就需要在技術上尋求突破。
這些問題,也正是負責中臺產品研發的愛奇藝高級總監張沖需要思考的問題。
張沖在大會上指出,愛奇藝在2011年上線的會員產品中的卡券,在過往14年里經歷了五個大的版本迭代,已經累計擁有百億規模數據量,形成了復雜的技術架構。
例如,當時在愛奇藝的數據架構中,TP業務基于MySQL,AP業務則是基于Elasticsearch,在數據流服務中需要經歷MySQL到Elasticsearch(ES)的準實時同步,甚至也需要進行定期任務歸檔清理,也是由此,這套數據架構中的每個節點都需要投入大量的精力進行維護。
![]()
據張沖透露,“在這套數據架構中,整個技術需求帶來的帶來的投入占比最高甚至超過了整個產品研發投入的80%。”
大量數據同步維護需要額外的RMQ等非必要組件,準實時性分析延時達到分鐘級,統計分析準確率低,ES清理歸檔代價較高、Reindex開銷較大,這一系列業務痛點,讓愛奇藝在進行第六代卡券研發時,希望可以有一個TP、AP一體化,不需要花精力去處理異構數據,可以盡量少依賴底層的湖倉這類重型產品,同時又可以實現降本增效的數據庫產品。
張沖當時在進行市場調研中發現,Oceanbase的數據庫產品天生具備TP、AP融合的一體化特性,通過多副本原生分布式形態,又可以很簡單地實現從同城雙活到異地多活的架構升級,于是決定面向Oceanbase進行數據遷移。
在AP業務經過全量表由ES到Oceanbase集群遷移后,AP業務實現了秒級延時,存儲壓縮高達75%,整體TCO也下降了60%;在TP業務經過MySQL向Oceanbase集群遷移后,不僅實現了存儲的彈性伸縮,TP業務存儲成本也下降了80%。
如今愛奇藝的第六代卡券技術架構更簡單了,簡單到只有計算和存儲,這其中,高并發、高可用、數據治理、低成本等方面的技術復雜性都被濃縮到了Oceanbase一體化產品中。
![]()
愛奇藝基于Oceanbase的技術轉型,只是Oceanbase這些年通過技術工程化優勢服務產業的一個縮影。
回顧過去十五年,楊冰特別強調的是兩個關鍵詞,一個是工程化,一個是正確性。
就工程化而言,楊冰指出,數據庫是一個非常復雜的系統,所有復雜系統對工程化要求都很高,既需要有優秀的頂層設計,又需要基于原子化結構一層一層向上搭建,每一部分的原子化都要足夠簡單、足夠可靠。
Oceanbase研發團隊正是基于這樣的理解,從最基本的原子化結構,將數據結構、基礎算法等基礎單元打磨好后進行有機結合,由此支撐起這樣一套復雜的系統。
就正確性而言,則是自成立之初就刻在了Oceanbase團隊骨子里的文化基因。
早期脫胎于阿里集團和螞蟻集團的Oceanbase,本就需要具備金融級穩定性,在2015年前后完成核心業務替代過程中,花費了大量精力在干“正確性”這件事——當時在數據庫應用過程中,但凡涉及數據轉移,Oceanbase團隊都要進行主備之間或多個副本之間的數據校驗。
據楊冰透露,“為了解決‘正確性’問題,Oceanbase代碼中,有50%以上的代碼都在做容錯或異常處理,這在生產級系統中是罕見的。”
正因如此,“不相信任何硬件和軟件,只相信自己,”成了Oceanbase內部一條延續至今的鐵律,也成了Oceanbase可靠性、穩定性的基礎。
![]()
02 AI原生數據庫,OB的設計思路
2025年4月27日,Oceanbase正式對外發布了DataxAI的戰略,人工智能由此被寫入Oceanbase企業戰略中。
那么,在過去這一年里,Oceanbase有打造出怎樣的AI數據庫產品?
seekdb,正是Oceanbase給出的答案。
![]()
seekdb是Oceanbase在這次大會上首發的開源數據庫產品,準確來說,是AI原生數據庫產品。
楊冰在大會上指出,“seekdb不是傳統數據庫的功能疊加,而是專為AI時代重構的AI原生數據庫,它繼承Oceanbase的代碼和設計理念,更輕量、更敏捷,目標是成為大模型與私有數據融合計算的‘實時入口層’。”
在會后接受媒體采訪時,楊冰對于這一產品還給出了一個形象的比喻,“Oceanbase數據庫會用增程式方式逐漸將AI能力不斷加進來,而seekdb更像是純電動化方式,以AI原生方式更快速、輕量化探索AI原生數據庫的可能性。”
據悉,seekdb支持向量、全文、標量及空間地理數據的統一混合搜索,深度融合了AI推理與數據處理,并兼容Hugging Face、LangChain等30余種主流AI框架,開發者只需要三行代碼,就可以快速構建知識庫、智能體等AI應用。
![]()
本質上,seekdb可以稱得上是Oceanbase一款戰略級產品,一款為了加速面向AI創新,面向開發者打造的一款AI原生的混合搜索開源數據庫。
在這款產品背后,還藏著Oceanbase一個更大的野心——定義AI原生數據庫。
就AI原生數據庫,楊傳輝給出的定義是,“面向Agent多模混合搜索數據庫。”
楊傳輝在大會上指出,“在AI時代,數據庫除了要處理結構化數據,還需要更多去處理半結構化,甚至無結構化的數據,數據庫除了是做關系模型,還需要做Json處理半結構化數據,或者針對無結構化數據建立各種語義索引,例如向量索引、圖索引、全文索引等,這就需要我們有一套基于結構化、半結構化,以及無結構化數據的各種索引之上的混合搜索引擎。”
正因如此,楊傳輝認為,“向量數據庫只是AI數據庫的初級階段,能否支持混合搜索將會成為AI數據庫的‘分水嶺’。”
不過,在AI時代,數據庫既有變遷,也有不變。
楊傳輝認為,“變的是面向Agent的多模混合搜索復雜的出現,不變的則是一體化架構帶來的核心技術能力。”
![]()
楊冰在大會上同樣指出,一體化數據庫依然會是未來構建企業面向AI時代的數據架構的數據底座。
這樣的一體化被楊冰拆解為三個方面:
一體化架構,從單機分布式到多云原生,滿足AI應用快速迭代;
一體化存儲,從結構、半結構到非結構化數據,支持AI多模數據存儲;
一體化負載,從數據生產、分析到混合搜索,支撐AI原生多元負載。
實際上,基于這樣理念打造的,不僅僅是seekdb,還有此次大會上正式對外發布的Oceanbase首個一體化融合版本4.4版本。
![]()
楊傳輝在會后接受媒體采訪時告訴我們,“seekdb是基于Apache2.0,采用全開源模式和開源社區的開發者們一起快速演進、快速探索的AI原生數據庫,seekdb會快速迭代出很多AI原生功能,這些功能Oceanbase也會很快地進行跟進。”
此外,同樣是在這次大會上,圍繞多模混合搜索數據庫,我們看到Oceanbase發布了一系列配套產品,這其中既有PowerRAG、PowerMem這樣的配套工具,也有MaaS平臺、Oceanbase AI Stack智能一體機。
這一系列技術、產品和解決方案,構成了Oceanbase面向AI原生數據庫的全棧AI初步探索。
03 借力AI,走向全球
在Oceanbase十五周年之際,我們發現,Oceanbase開始加快全球化步伐。
楊冰認為,要全球化,必然要做好三件事:
經歷世界級挑戰、得到頂級客戶的認可、在全球主流市場持續拓展業務。
這三件事,又恰巧與Oceanbase的成長經歷不謀而合。
Oceanbase出生之初面臨的就是“雙十一”這樣世界級的難題,而在隨后的發展過程中,Oceanbase又從原本擅長的電商、金融領域,不斷向交通、能源、醫療、人社、運營商等領域突破。
例如,在高增長的智能制造領域,Oceanbase服務了寧德時代的GMC電池指標系統升級,單次處理效率從2分鐘縮短到30秒,讓寧德時代電池電芯流轉效率大幅增加;
![]()
再如,在汽車的實時分析場景,Oceanbase服務了零跑汽車的“零小跑”營銷系統升級,商機時效提升了20倍,解決了零跑汽車“數據查詢時效”瓶頸。
值得注意的是,Oceanbase服務的這些中國TOP級企業,正在成為全球頂級玩家,這讓這些企業背后的服務商Oceanbase的能力開始在全球得到“認證”。
與此同時,我們還看到,Oceanbase在大力打造全球經銷體系。
據楊冰在大會上公布的數據顯示,“2025年,Oceanbase在專有云方面的收入已經有70%來自于伙伴,公有云方面的收入有30%來自于伙伴,并實現了300%的年增速。”
![]()
在此次發布會上,Oceanbase還特別官宣了與用友的戰略合作。
楊冰告訴我們,“應用開發商生態對數據庫來說非常重要,而用友在中國的地位類似全球市場中的SAP,通過這樣的落地,能夠讓OB更廣泛地滲透到更多的通用場景當中,實際上,我們也在和海外同類的ERP廠商在做對接。”
![]()
一邊塑造全球品牌影響力,一邊構建全球服務體系,據大會上公布數據顯示,實際上,自2020年商業化以來,Oceanbase全球客戶數已突破4000家,連續五年年均增速超100%。
這其中,Oceanbase的技術和產品已深入金融、政務、通信、零售、制造、互聯網等十余領域,服務覆蓋16個國家和地區、60多個地域、240多個可用區。
也是在這樣的背景下,全球迎來了人工智能的時代拐點,在這個拐點來臨之際,全球計算范式、數據能力經歷著一場深刻的變革,這時,全球數據庫產業將再次來到一個新起點。
楊冰在大會上也特別指出,“AI時代,讓我們離‘世界級數據庫’的夢想又近了一些。”





京公網安備 11011402013531號