OceanBase全面擁抱AI!首發PowerRAG產品,CTO楊傳輝詳解AI戰略
一體化和Data??AI
允中 發自 凹非寺
量子位 | 公眾號 QbitAI
全面擁抱AI之后,OceanBase首次詳解了他們的戰略。
第三屆開發者大會上,OceanBase發布了面向AI的應用產品PowerRAG——
主打RAG開發能力開箱即用,打通應用開發數據層、平臺層、接口層與應用層的全流程。
它可以幫助用戶實現文檔知識庫、智能對話、圖像比對、數據分析等多種AI應用場景的快速開發。

作為他們AI應用層面探索的第一步,首次以AI戰略一號位現身大會的CTO楊傳輝進一步解釋了產品背后的戰略驅動:OceanBase正致力于構建Data×AI能力,面向AI時代推動一體化數據庫向一體化數據底座的戰略演進。
這是OceanBase戰略升級的第一個大動作,時間間隔不過一個月。
2025年4月27日,OceanBase CEO 楊冰發布全員信,宣布OceanBase將全面進入AI時代,并且為保障戰略推進,OceanBase啟動人才和組織體系升級,任命CTO楊傳輝擔任AI戰略一號位,并成立AI平臺與應用部、AI引擎組等新部門。
這樣的推進速度,不難看出OceanBase背后的AI決心和氣魄。而本次開發者大會呈現出他們對于數據與AI融合的思考,在大模型行業應用進入深水區的此刻,其實值得參考。
數據在AI時代的重塑:從挑戰到基礎設施革新
AI技術的爆發式發展正在重塑數據生態,已經成為行業共識。據IDC數據預測,受到生成式AI等技術驅動,新生成數據量規模將達到393.9ZB,其中企業數據規模和增速尤為凸顯,非結構化數據將是最主要的企業數據形式,占比將超80%。
海量數據的爆炸式增長,讓傳統數據基礎設施面臨前所未有的挑戰。數據存儲容量告急、存儲架構擴展形不足、數據管理效率低下,數據分析實時性滯后正在倒逼行業思考:如何構建AI時代的新型數據基礎設施?

AI從Task-specific到General的進化,給數據提出了更高維度的需求。螞蟻集團CTO何征宇在分享中指出,海量的互聯網數據成就了今天的大模型,但大模型幻覺問題的源頭也是數據問題。數據決定著大模型的能力上限,且依舊有很大挑戰:一是數據的獲取成本顯著增加,二是嚴謹的行業數據稀缺且流動困難,三是多模態數據需要更強的處理能力,四是數據的質量評估難。
無法數字化,就無法智能化。在傳統企業場景中,要想實現智能化,前提實現數字化,只有充分挖掘數據要素,才能通過AI來釋放它的價值。
能夠看到的是,AI與數據之間的關系遠比以往都更為緊密。數據驅動AI,而AI正在推動Data Infra 向 Data × AI Infra 演進。
數據基礎設施的革新方向已清晰可見,但是現有數據基礎設施可能無法跟上AI的需求。
企業大模型落地面臨著成本、準確性和數據安全三大挑戰。
數據孤島導致跨系統整合成本激增,企業需為分散的存儲、冗余計算(如多副本ETL)及數據庫人工運維支付高昂溢價;長尾場景下的一些碎片化數據難以為模型提供完整”知識圖譜”,往往導致數據準確性不足;當數據儲存在單機或者單片云時,是有可能因為外部故障而面臨數據泄露的風險,而用大模型做個智能應用本身開發周期就太長,整個風險的窗口期就拉長,這個過程成本也很高。
既然如此,行業該如何破局?承載著數據處理與分析的責任,數據庫廠商正在加速探索,以OceanBase為代表,15年持續深耕海量核心場景Know-how,它的系列動作或許值得關注。
一方面,OceanBase 堅持100%根自研,自 2010 開始投入研發,目前已支持支付寶全部核心賬務、核心支付系統,連續十余年穩定支撐雙 11,歷經流量洪峰和穩定性考驗。全球唯一接連打破“數據庫世界杯”TPC-C 和 TPC-H 測試紀錄,入選世界互聯網領先科技成果獎。
在商業化上,OceanBase已助力金融、政務、運營商、零售、互聯網等多個行業的2000多家客戶實現關鍵業務系統升級。
另一方面,它正在全力擁抱AI,積極布局戰略升級。他們會如何做,也能給正在等待AI轉型升級的企業一個參考。
CEO楊冰的全員信中,其實就已經透露他們接下來的發展目標:
我們將形成AI時代從一體化存儲(行存、列存、KV、文檔、向量、倒排)到一體化計算(OLTP、OLAP、NoSQL、向量數據庫、搜索、推理、RAG)的全方位布局,依托螞蟻的豐富應用場景將OceanBase的“Data × AI”能力打磨成為新的核心競爭力,并逐漸服務外部客戶,打造如分布式技術般的世界級AI數據底座。
而此次開發者大會,正是他們向外界展示的首次實踐。
OceanBase給出答案:一體化數據底座
面對行業的真實需求,OceanBase正在大膽探索。CTO楊傳輝表示,作為一體化分布式數據庫,OceanBase已經具備了一定的AI時代數據處理能力。
比如分布式有效應對海量數據的存儲計算、多模融合統一處理不同結構數據、TP/AP一體化實現混合事務和實時分析處理。
在支持AI應用落地的核心基礎設施——向量性能、混合檢索等層面,OceanBase也有新的突破。
大會現場,基于基準測試工具VectorDBBench,采用Performamce768D1M測試數據集,OceanBase與業內三款領先的開源向量數據庫進行性能跑分測試。結果顯示,OceanBase的向量性能已經達到開源向量數據庫業內的領先水平。

而面對AI時代的海量數據,OceanBase還引入BQ量化算法(HNSW+BQ),大幅降低向量場景的內存需求;引入針對JSON半結構化數據的壓縮能力,降低AI場景中的半結構化數據存儲成本。此外,OceanBase已具備面向多種數據模型的混合檢索能力。
再加上PowerRAG,一改傳統的開發模式(組件森林開發模式、RAG平臺模式等),主打開箱即用。
以上能力和產品,背后依托于OceanBase對于大模型落地價值的思考以及“一體化數據底座”的戰略思路。
他們認為大模型落地產生價值的核心在數據與模型的一體化融合。更形象地表述是,數據與AI的關系不再是簡單的Data+AI,應該是Data×AI。

基于Data×AI能力,OceanBase致力于從一體化數據庫朝著一體化數據底座演進。
在過去15年產品技術演進中,一體化早已注入了OceanBase的靈魂。甚至從架構設計的第一天就被視作自然而然的選擇:通過分布式架構底座將多個關鍵能力融合到一個引擎和一套數據庫。
從最初的工程一體化、多租戶、多兼容模式,演進到 HTAP 工作負載一體化(混合事務/分析處理),再到單機分布式一體化、多模型、多數據接口,以及面向未來多云基礎設施的存算分離引擎,可以說一體化本身就是OceanBase產品迭代發展的核心。
當下更海量更復雜數據規模、混合負載的需求,一體化數據底座也成為廣泛的市場需求。它的底層需要實現單機分布式一體化和云上云下一體化,也就是單機分布式一體化架構和多云原生架構,對用戶來說它需要提供一套統一支持SQL、AP和AI的數據底座。
AI時代的數據底座
此次 OceanBase 所展現出來的數據底座探索和創新,對整個數據庫行業以及AI應用生態發展都可能帶來多維度推動作用。
首先,AI時代的數據基礎設施正在從“被動存儲”到“主動賦能”的范式轉換。以往數據基礎設施隱于技術之后,廠商更多是針對單一性能、單點需求進行優化和解決,沒有形成整體的整合與協同。
現在當AI賦能應用層,數據基礎設施面向 AI 提供開發 AI 創新應用的能力,如推理能力、向量能力、RAG 能力、混合檢索能力等,以滿足 AI 創新應用對數據基礎設施的全面需求。
這也就給其他廠商跟進優化自身的產品,朝著數據與模型一體化融合的方向研究和實踐提供一個參考。

其次,AI時代的數據底座,可能呈現出這幾個方面的特點。
多模態融合,支持結構化(SQL)、半結構化(JSON)、非結構化(向量/文本)數據的統一存儲與混合檢索能力。
混合負載處理能力,AI時代將工作負載的邊界模糊了。通過HTAP引擎實現OLTP(事務處理)與OLAP(實時分析)的融合,以適應復雜的處理需求。
此外,還包括成本與性能的極致平衡、AI原生功能集成等特點。
最后,在AI廣泛應用落地中,數據庫廠商是整個生態中關鍵一環。通過提供高效、易用的數據底座解決方案,降低企業開發 AI 應用門檻,從而實現AI的普惠。
從OceanBase Data x AI的全景圖可以看到,作為最底層的一體化數據底座,OceanBase需要和下層模型,以及上層的Agent平臺,AI應用做適配。比如當前在流行的MCP大模型生態。
也就意味著,AI場景價值落地,還是離不開生態合力,通過”數據-模型-應用“形成正向循環,促使全行業加速向多模態、低成本、易用性方向演進。
未來,隨著更多企業加入這一生態,AI技術將真正成為普惠生產力,而OceanBase的實踐無疑正在為這一未來筑牢“地基”。
- 空間智能卡脖子難題被杭州攻克!難倒GPT-5后,六小龍企業出手了2025-08-28
- 陳丹琦有了個公司郵箱,北大翁荔同款2025-08-28
- 英偉達最新芯片B30A曝光2025-08-20
- AI應用如何落地政企?首先不要卷通用大模型2025-08-12



