Zleap技術解密:后RAG時代已來,SAG重新定義AI搜索
SAG可以成為企業、個人乃至整個Agent領域的底層技術支撐
大家好,我是Jomy,是智躍Zleap的CEO,也是Zleap產品和技術的主要設計者。
此前在報道中,我曾粗略介紹過Zleap產品背后的技術:一個能幫助CEO自動整理、總結海量企業內部信息的智能Agent。今天,我要正式為大家介紹驅動這個Agent的底層技術:SAG。
這個產品發布后獲得了不少關注。但最近,在與多位朋友、客戶和投資人交流的過程中,我有了新的認知:SAG的潛力遠不止服務于管理者的Agent一體機,它可以成為企業、個人乃至整個Agent領域的底層技術支撐,推動AI行業向前邁進一小步。
所以我今天就和大家詳細講解一下,SAG背后的技術原理和應用方向。
SQL驅動
SAG的全稱是SQL-Retrieval Augmented Generation,即檢索部分主要由SQL驅動。
傳統RAG是向量驅動的:將問題轉化為向量,在原文的向量空間中模糊匹配語義,找到相似度較高的分塊,最后傳給LLM回答。這個方案高效,但缺點明顯——過于依賴原文相似度,無法進行深度檢索。

后來出現了GraphRAG,基于知識圖譜的檢索。其原理是先用LLM分析原文,生成實體和關系,再進行檢索。本質上是讓LLM對原文進行深度分析和提取,創造了一個中間層,通過知識圖譜將問題和答案關聯起來。這個方法效果不錯,但缺點也很明顯:速度慢、成本高,且增量數據需要重新生成圖譜。

我們的SAG在傳統RAG和GraphRAG的基礎上更進一步。它結合了SQL的精準檢索和向量的模糊匹配能力,在檢索過程中實時構建數據關系,打破了RAG領域的”不可能三角”——同時實現快、準、全。
自然語言向量
SAG的一個重要環節是最初的數據處理。
與GraphRAG類似,SAG也會創建一個中間層,我稱之為”事件“。其核心是將繁雜的信息提煉為一個個原子化的事件,類似人腦將一個復雜的事拆解成多個簡單的事。
但與GraphRAG不同的是,SAG不會在數據處理時就生成事件之間的關聯,而是在查詢時實時計算事件關系,從而解決了增量數據更新的問題。
那么如何將不同事件關聯起來,正是SAG的核心所在。背后的奧秘是:在數據處理階段,SAG不僅只是提取事件,還會為每個事件提取多維度的屬性,我稱之為”自然語言向量“。

類似于向量用不同的數字在不同維度表達語義,自然語言向量則用不同的屬性作為維度,屬性的值對應維度的值。不同的事件,維度是相同的,例如時間、地點、行為、人物等。這個過程本質是讓LLM把事件中的關鍵Token進行了結構化+泛化處理。
總之,每個事件都可以用一個自然語言向量來表達其大部分語義。

提取事件和屬性這件事只需要很小的模型就能完成,大大降低了算力的成本。而且在SAG中,維度是可以自己定義的,不同的行業根據自己數據類型的不同,可以增加一些專有的維度。
六度分隔理論
那么為什么自然語言向量可以在查詢時實時構建不同事件的關系?這個靈感我是來自社會工程學中的”六度分隔理論“。
六度分隔理論簡單來說就是:你和任何陌生人之間相隔不超過六個人。比如A認識B,B認識C,A和C可能沒有任何交集,但因為A和B有交集,B和C有交集,A就和C產生了聯系。

類比到SAG中,人就像事件,交集就像相同的屬性。所以理論上,任何事件之間都可以通過中間事件的共同屬性產生聯系。

而事件和屬性在數據處理時就已提取完成,查詢時只需在SQL中檢索,無需LLM參與,因此實時構建數據關系的計算是極其快速的。
馴化不確定性
大家都知道,SQL是精準匹配,如何應對用戶千奇百怪的提問呢?比如當你檢索”蘋果公司”時,是無法通過SQL關聯到”Apple Inc”。為了解決這個問題,我就利用了向量的語義匹配能力。
SAG會將所有屬性同時存入向量數據庫和SQL數據庫。當你搜索”蘋果公司”時,向量可以語義匹配到”Apple Inc”,甚至可以匹配到“iPhone”。此時再拿著”蘋果公司”、”Apple Inc”和“iPhone”去SQL中查詢,就不會有遺漏了。

傳統基于向量的檢索非常擅長進行語義的模糊匹配,但又有很大的不確定性。SAG恰恰利用這一點,結合了向量和SQL的優勢——以SQL為主,馴化了向量的不確定性,做到了魚和熊掌兼得。
當馴化了不確定性,SQL的優勢就凸顯出來了。例如我們可以針對某幾個屬性精準和完整的檢索,甚至可以直接對某個屬性的事件進行統計。由于SAG的SQL表結構相當簡單,LLM的Text-to-SQL能力完全能夠勝任。
累積效應
SAG讓每一次檢索都更精準,這也帶來了顯著的累積效應。
以往大家覺得RAG的多跳效果一般,本質上是因為”Garbage In, Garbage Out“——首次檢索質量不高,再多輪也起不了太大作用。
而SAG顯著提升了每一次原子檢索的質量,為LLM提供了更多關聯事件,多輪推理的效果也會有質的飛躍。

企業的應用
SAG的本質是利用AI將非結構化數據轉化為結構化數據,這在企業場景中蘊含著巨大的應用潛力。
首先,作為企業智能決策助手。
就像我們的首款產品Zleap-D1 Agent一體機,SAG能夠喚醒企業沉睡的歷史數據,實時連接最新業務數據,通過報告、搜索、問答等應用形態,為管理者提供決策輔助和全新的商業洞察。

其次,作為通用數據處理引擎。
SAG可以作為獨立的數據處理器,重構企業現有的所有數據。無論是電商推薦、金融風控,還是廣告投放,都能從中獲益——用更智能的數據顯著提升原有算法的效果。

最后,作為低成本的AI轉型方案。
SAG能夠幫助傳統企業跨越信息化階段,直接邁入AI化時代。SAG通過AI將繁雜的非結構化信息轉化為統一的數據格式,為更深層的應用場景奠定了堅實的數據基礎,有望加速整個toB應用生態的發展。而且SAG的數據處理是異步進行的,不僅可以使用小模型,還可以利用起夜間的閑置算力,讓企業以更低的門檻處理海量歷史數據,真正邁入AI時代。
個人的應用
SAG在個人應用方向同樣前景廣闊。
首先,作為個人知識庫的底座。SAG可以讓你的筆記、文檔、收藏真正變成可檢索、可關聯的知識體系,而不只是一堆躺在文件夾里的信息。
其次,作為個人AI的記憶中樞。讓AI更好的記住你的偏好、習慣、歷史對話,真正成為懂你的智能助手。
更重要的是,SAG足夠輕量。由于對算力需求極低,經過精簡的系統甚至可以完全離線運行在手機上,效果依然出色——你的數據永遠在你自己手里。

Agent的應用
對于Agent來說,上下文工程已經成為Agent開發的核心共識,但現有的上下文檢索往往過于粗暴。比如Claude Code的grep搜索,只能做正則匹配,缺乏深層次的結構化理解。

而SAG可以成為未來Agent的記憶與數據基座,快速為Agent提供更精準、更優質的上下文。就像前面提到的累積效應——在更好的上下文加持下,原本需要10步才能完成的任務,可能3步就能搞定,大幅提升Agent的運行效率和成功率。
開源
總的來說,SAG是新一代的RAG技術,融合SQL與向量的優勢,實現了快速、準確、全面的AI檢索,為企業、個人和Agent領域提供了更強大的數據基座。
為了可以讓所有企業都可以使用到SAG技術,也希望為行業發展貢獻一份力量,我們決定將這個技術開源:
https://github.com/Zleap-AI/SAG
本次由于篇幅問題,其實有的非常多的細節并沒有講,比如事件和屬性通過具體什么算法進行動態關聯,又比如多輪召回時的動態剪枝策略等等,關于更具體的算法和原理,請查看我們的開源代碼。也歡迎有興趣的企業和高校與我們合作探索。
總結
我們認為,SAG的價值遠不止于替代RAG——它更大的意義在于,能以極高效率將各種信息轉化為統一的多維知識圖譜。設想這樣一個未來:SAG通過一個簡潔優雅的數據格式,打通所有信息源,讓數據不再是孤島,而是可以互相連接甚至交易的資產。而這些海量的結構化數據,又可以被AI充分檢索和利用,推動整個社會生產效率的躍升。
這就是我們智躍Zleap的愿景:讓所有信息產生連接,讓所有數據成為資產。
為了大家更方便地體驗這個技術的能力,我們也為普通用戶做了一個產品,可以將公共信息和私人信息聚合在一起,定時生成報告,或進行問答和搜索。
由于產品仍處于Beta階段,我們實施了邀請碼機制。邀請碼將通過智躍公眾號定期發布,感謝您的關注。
Web:https://app.zleap.com.cn
APP:iOS App Store搜索Zleap
- 知名數學家辭職投身AI創業:老板是00后華人女生2025-12-06
- Runway Gen-4.5刷屏發布,把重量塵土和光影都做對了,網友:顛覆2025-12-02
- 靈光 “一閃”,330萬個“閃應用”已創建2025-12-02
- AI也會被DDL逼瘋!正經研究發現:壓力越大,AI越危險2025-12-01




