![]()
在人工智能技術迅猛發展的今天,數據庫的角色正在經歷深刻變革。
曾經作為“數據倉庫”被動存儲信息的數據庫,如今正加速演變為驅動業務決策的“智能中樞”。這一轉變不僅帶來了技術層面的革新,更對數據庫系統的底層架構和綜合能力提出了全新要求。但技術熱點的層出不窮往往容易讓人眼花繚亂,真正能夠穿越技術周期、支撐企業核心業務穩定運行的,是扎實的工程化能力。
這恰恰成為檢驗數據庫廠商實力的試金石,也是決定企業AI戰略能否成功落地的關鍵所在。“Oceanbase對于技術工程化的追求,是他們(客戶)選我們的重要原因。”在日前舉行的2025 Oceanbase年度發布會上,CEO楊冰如此總結過去十五年贏得客戶信賴的原因。數據顯示,Oceanbase當前客戶數突破4000家,連續5年客戶數年均增長超100%。
![]()
延續工程化的理念,今年,針對AI應用需求的爆發,Oceanbase重磅推出了首個AI原生混合搜索數據庫seekdb,想要推動數據庫從傳統“業務支撐系統”邁向“AI原生數據入口”。這是這家經歷十五年長跑的國產數據庫,自啟動“Data×AI”戰略以來,幾經打磨交出的一份新答卷。
十五年技術長跑,淬煉工程化基因
Oceanbase的十五年,是一部由真實業務壓力驅動的技術進化史,并塑造了其獨特的工程化基因。
從支撐支付寶“雙11”單日6100萬次/秒的數據庫處理峰值,到服務全球4000余家企業,Oceanbase的每一步都踩在業務需求上,每一次架構躍遷都源于對具體場景難題的攻堅。而業務場景的特殊性,也給Oceanbase提出了極高要求,“只有一次機會,一次就要做對。那就意味著從代碼設計、代碼規范、測試上線等一系列的環節都不能有大的失誤。”Oceanbase CTO楊傳輝表示。
除了場景,據Oceanbase內部人士介紹,這種獨特的技術文化深深植根于創始人陽振坤的技術理念,并在團隊中代代相傳。陽振坤博士從項目立項之初,就為Oceanbase定下了“做世界級的數據庫”這一高遠目標,并將“追求極致細節”的工匠精神融入團隊血脈,這深刻影響了Oceanbase對待技術和產品的態度。
![]()
不追求表面炫技,而是專注于解決實際問題,Oceanbase內部盛行“用benchmark說話”的風氣,任何技術方案的優劣都通過嚴謹的測試和實際數據來驗證。“如果你做的東西沒有辦法專注到細節,就講一些泛泛的東西,在Oceanbase的技術團隊里面是得不到尊重的,大家會覺得你不太懂。”楊傳輝坦言。
對工程化近乎偏執的堅守,讓Oceanbase這十五年的技術演進,經歷了幾個關鍵的技術里程碑,它們逐步構建起今日的一體化架構能力。
首先是原生分布式架構的奠基。Oceanbase從一開始就選擇了兩條關鍵的技術路徑:基于LSM-Tree的存儲引擎和基于Multi-Paxos的數據一致性協議。LSM-Tree存儲引擎為海量數據的高效寫入與存儲提供了底層支撐,而Multi-Paxos協議則在分布式環境下保障了數據的強一致性。這兩項核心技術的選擇,展現了團隊對分布式數據庫本質的深刻理解,為后續所有能力的構建奠定了基礎。
其次是單機分布式一體化架構的突破(V4.0版本)。傳統認知中,分布式數據庫往往意味著復雜的部署和一定的性能損耗,而單機數據庫則難以擴展。Oceanbase 4.0版本打破了這一固有認知,首創單機分布式一體化架構,使得數據庫在單機環境下也能具備分布式能力,同時在分布式場景下保持極致性能。這一創新極大地降低了用戶的使用門檻,讓企業可以根據自身業務發展階段平滑演進,無需在架構選擇上過早下注。
再次是這次新推出的TP/AP/AI融合的一體化內核(V4.4版本)。面對AI時代的多模數據和混合負載需求,Oceanbase 4.4版本首次將TP(事務處理)、AP(分析處理)與AI能力集成于單一內核。這意味著,企業可以在一個數據庫中同時處理高并發交易、復雜數據分析以及AI驅動的混合搜索,無需維護多套系統。這種深度融合,是對數據庫架構的一次重大重構,充分體現了Oceanbase在工程化方面的深厚積累。
通過這三個關鍵技術節點的突破,Oceanbase以工程化能力為驅動,不斷重新定義分布式數據庫的技術邊界,為AI時代的數據底座構建了堅實的技術基礎。
工程化內核:正確性、穩定性與架構創新
數據的正確性是數據庫的生命線,尤其在金融交易、政務管理等關鍵場景,一個字節的錯誤都可能引發災難性后果。Oceanbase將“正確性第一”奉為工程化實踐的核心準則,為此構建了一套從代碼到硬件的全鏈路掌控體系。
在軟件層面,Oceanbase堅持根自研路線,從零開始編寫代碼,對每一行指令都保持極致掌控。其300萬行核心代碼中,超過50%用于構建自檢機制,從數據在內存中的流轉、主備節點間的同步,到落盤存儲的校驗,形成了一張密不透風的“防護網”。
硬件層面,Oceanbase選擇繞過操作系統的部分抽象層,直接操控CPU、內存與磁盤資源。通過自研內存管理機制優化數據緩存策略,基于磁盤I/O特性設計存儲布局,甚至對網絡傳輸協議進行深度定制,實現了對硬件資源的精細化利用。
“我們內部流行一句話,不相信硬件,也不相信任何的軟件,我們只相信我們自己。”在現場,楊冰如此總結工程化精神。這種對工程化的偏執雖然大幅提升了開發復雜度,卻為系統穩定性和性能優化奠定了底層基礎。
傳統數據庫架構在AI時代面臨嚴峻挑戰:事務處理(TP)、分析處理(AP)與AI推理負載分散在不同系統,導致數據孤島、鏈路冗長和資源浪費。Oceanbase以一體化架構打破這一困局,其核心在于實現多模數據融合、多工作負載融合與數模融合等“三大融合”,形成真正意義上的一體化數據基座。
在混合搜索場景中,傳統架構需調用向量數據庫、全文搜索引擎和關系型數據庫才能完成一次復雜查詢,而Oceanbase通過“粗排+精排”多階段檢索機制,可在毫秒級內完成向量語義匹配、關鍵詞精確查找與標量條件過濾的融合計算。
“如果不是工程化文化,我們會走另外一條路線,出5個產品,分布式TP、單機TP、分布式AP、單機AP等都分別出一個,但我們最終只做了一個。這些工程化的挑戰被我們‘吃掉’以后,對用戶就意味著拿到一個非常簡單、高效、統一的方案——這是AI時代的要求,也是現代化數據架構的根本要求。”楊傳輝表示。
體現在金融反欺詐場景中,Oceanbase能實時響應規定時間段內復雜篩選條件的復合查詢,無需跨系統拼接結果。這種原生一體化設計,較傳統多系統架構性能成倍提升,同時顯著降低運維成本。此外,4.4版本引入的共享存儲架構,更是將存算分離推向新高度,計算節點可彈性擴縮、存儲成本較傳統方案降低50%-90%,這都為AI時代的海量數據存儲提供了經濟高效的解決方案。
這種架構創新從數據庫內核層面深度重構,解決了AI時代打通多云底座的核心能力,也彰顯了Oceanbase以工程化思維解決復雜問題的能力。
AI時代以工程化重構數據庫能力
面對AI時代多模態數據檢索與實時推理的需求,Oceanbase推出首款AI原生混合搜索數據庫seekdb,以“輕量、敏捷、開源”為核心定位,重新定義AI數據基座的工程化標準。其核心突破在于首創“向量+全文+標量+GIS”四維混合搜索能力,通過“粗排+精排”多階段檢索機制,在百億級數據規模下實現毫秒級響應。
![]()
據悉,seekdb并非簡單集成向量搜索插件,而是以工程化思維重構AI數據基座。它繼承Oceanbase分布式內核的基因,并將部署門檻進一步降低,最低起步配置僅需1核CPU、2GB內存,支持pip install一鍵安裝、秒級啟動,兼容嵌入式與客戶端/服務器雙部署模式,讓開發者無需關注底層架構即可快速構建知識庫、智能體等應用。
同日,seekdb也宣布以Apache 2.0協議全球開源,無縫對接LangChain、LlamaIndex、Dify等30余種主流AI框架。同步開源PowerRAG智能文檔解析框架與PowerMem分層記憶架構,后者在LOCOMO Benchmark測評中以78.70分刷新SOTA紀錄,Token消耗降低96%。
Oceanbase的混合搜索能力已在聯通統一AI知識庫、螞蟻百寶箱智能體等場景充分驗證了技術價值。中國聯通基于混合搜索構建統一AI知識庫,有效解決了私有文檔的權限管理與高效檢索難題;螞蟻百寶箱則基于混合搜索實現智能體的實時在線搜索,顯著提升了信息獲取的精準性與響應效率。
在這之外,數模融合是Oceanbase原生AI架構的另一核心突破。數據庫內置AI Function能力,支持在SQL中直接調用Embedding模型生成向量,或通過Rerank優化檢索結果,形成“數據寫入-向量化-檢索-推理”的閉環。配套的MaaS平臺可管理主流大語言模型與國產GPU算力,實現模型微調、量化壓縮、推理加速的全生命周期管理。這種設計使AI能力與數據庫內核形成有機整體。
Oceanbase的實踐印證,唯有通過工程化重構實現的原生AI能力,才能真正突破“數據孤島”與“性能瓶頸”,支撐企業在AI時代的可持續創新。“這不僅是技術產品,更是開發范式的躍遷。”楊冰表示,“傳統數據庫只‘存’數據,而seekdb能‘理解’數據語義,混合搜索正是AI原生數據庫的關鍵分水嶺。”
Oceanbase的工程化能力已在全球市場獲得廣泛認可,截至目前,其服務的企業客戶數量已突破4000家,覆蓋金融、政企、能源、通信、零售、制造、互聯網等關鍵領域,服務網絡遍及全球16個國家和地區、60多個地域、240多個可用區。
競爭激烈的金融領域,Oceanbase憑借金融級的穩定性和可靠性,市場份額位居第一,成為眾多金融機構核心業務系統的首選數據庫。平安壽險將其7000人規模的財務系統遷移至Oceanbase平臺,實現了業務的穩定運行和高效管理,充分驗證了Oceanbase在支撐大型企業關鍵業務場景下的工程化實力。![]()
除金融領域外,Oceanbase在政務和通信行業也取得了顯著進展。全國三分之一的省級人社系統都采用Oceanbase構建數據底座,有效提升了社保服務的效率和穩定性。通信巨頭中國聯通基于Oceanbase混合搜索能力構建統一AI知識庫,成功解決了私有文檔的權限管理與高效檢索難題,進一步拓展了Oceanbase的應用邊界。
Oceanbase也正積極推進全球化戰略,重點布局東南亞、拉美和中東等新興市場,目標將海外營收占比提升至20%。這一進程中,工程化能力成為克服本地化挑戰的關鍵。在老撾,老中銀行采用Oceanbase構建核心業務系統,性能提升20倍、批量處理縮至30分鐘,成本僅為同類方案20%,實現中國自研數據庫海外銀行核心系統的首單落地。這些來自不同行業的實踐案例,充分證明了Oceanbase工程化能力在解決實際業務問題上的有效性,也為更多企業的數字化轉型提供了可參考的技術路徑。
據Gartner預測,到2028年,支持生成式AI的數據庫支出將達2180億美元,占市場74%。市場潛力巨大,世界數據庫行業也將因為AI時代的到來迎接一個新拐點。如楊冰所說,這個拐點不僅僅是工具的升級,更是計算范式以及數據能力的重塑,“把AI能力融進數據庫,變成內生動力,打造一個AI Native數據庫,這條路會使得我們離世界級數據庫的夢想更近。”(文|ToB深水區,作者|秦聰慧)





京公網安備 11011402013531號