Zleap技術解密：后RAG時代已來，SAG重新定義AI搜索

鷺羽 2025-11-18 11:17:48 來源：量子位

SAG可以成為企業、個人乃至整個Agent領域的底層技術支撐

大家好，我是Jomy，是智躍Zleap的CEO，也是Zleap產品和技術的主要設計者。

此前在報道中，我曾粗略介紹過Zleap產品背后的技術：一個能幫助CEO自動整理、總結海量企業內部信息的智能Agent。今天，我要正式為大家介紹驅動這個Agent的底層技術：SAG。

這個產品發布后獲得了不少關注。但最近，在與多位朋友、客戶和投資人交流的過程中，我有了新的認知：SAG的潛力遠不止服務于管理者的Agent一體機，它可以成為企業、個人乃至整個Agent領域的底層技術支撐，推動AI行業向前邁進一小步。

所以我今天就和大家詳細講解一下，SAG背后的技術原理和應用方向。

SQL驅動

SAG的全稱是SQL-Retrieval Augmented Generation，即檢索部分主要由SQL驅動。

傳統RAG是向量驅動的：將問題轉化為向量，在原文的向量空間中模糊匹配語義，找到相似度較高的分塊，最后傳給LLM回答。這個方案高效，但缺點明顯——過于依賴原文相似度，無法進行深度檢索。

后來出現了GraphRAG，基于知識圖譜的檢索。其原理是先用LLM分析原文，生成實體和關系，再進行檢索。本質上是讓LLM對原文進行深度分析和提取，創造了一個中間層，通過知識圖譜將問題和答案關聯起來。這個方法效果不錯，但缺點也很明顯：速度慢、成本高，且增量數據需要重新生成圖譜。

我們的SAG在傳統RAG和GraphRAG的基礎上更進一步。它結合了SQL的精準檢索和向量的模糊匹配能力，在檢索過程中實時構建數據關系，打破了RAG領域的”不可能三角”——同時實現快、準、全。

自然語言向量

SAG的一個重要環節是最初的數據處理。

與GraphRAG類似，SAG也會創建一個中間層，我稱之為”事件“。其核心是將繁雜的信息提煉為一個個原子化的事件，類似人腦將一個復雜的事拆解成多個簡單的事。

但與GraphRAG不同的是，SAG不會在數據處理時就生成事件之間的關聯，而是在查詢時實時計算事件關系，從而解決了增量數據更新的問題。

那么如何將不同事件關聯起來，正是SAG的核心所在。背后的奧秘是：在數據處理階段，SAG不僅只是提取事件，還會為每個事件提取多維度的屬性，我稱之為”自然語言向量“。

類似于向量用不同的數字在不同維度表達語義，自然語言向量則用不同的屬性作為維度，屬性的值對應維度的值。不同的事件，維度是相同的，例如時間、地點、行為、人物等。這個過程本質是讓LLM把事件中的關鍵Token進行了結構化+泛化處理。

總之，每個事件都可以用一個自然語言向量來表達其大部分語義。

提取事件和屬性這件事只需要很小的模型就能完成，大大降低了算力的成本。而且在SAG中，維度是可以自己定義的，不同的行業根據自己數據類型的不同，可以增加一些專有的維度。

六度分隔理論

那么為什么自然語言向量可以在查詢時實時構建不同事件的關系？這個靈感我是來自社會工程學中的”六度分隔理論“。

六度分隔理論簡單來說就是：你和任何陌生人之間相隔不超過六個人。比如A認識B，B認識C，A和C可能沒有任何交集，但因為A和B有交集，B和C有交集，A就和C產生了聯系。

類比到SAG中，人就像事件，交集就像相同的屬性。所以理論上，任何事件之間都可以通過中間事件的共同屬性產生聯系。

而事件和屬性在數據處理時就已提取完成，查詢時只需在SQL中檢索，無需LLM參與，因此實時構建數據關系的計算是極其快速的。

馴化不確定性

大家都知道，SQL是精準匹配，如何應對用戶千奇百怪的提問呢？比如當你檢索”蘋果公司”時，是無法通過SQL關聯到”Apple Inc”。為了解決這個問題，我就利用了向量的語義匹配能力。

SAG會將所有屬性同時存入向量數據庫和SQL數據庫。當你搜索”蘋果公司”時，向量可以語義匹配到”Apple Inc”，甚至可以匹配到“iPhone”。此時再拿著”蘋果公司”、”Apple Inc”和“iPhone”去SQL中查詢，就不會有遺漏了。

傳統基于向量的檢索非常擅長進行語義的模糊匹配，但又有很大的不確定性。SAG恰恰利用這一點，結合了向量和SQL的優勢——以SQL為主，馴化了向量的不確定性，做到了魚和熊掌兼得。

當馴化了不確定性，SQL的優勢就凸顯出來了。例如我們可以針對某幾個屬性精準和完整的檢索，甚至可以直接對某個屬性的事件進行統計。由于SAG的SQL表結構相當簡單，LLM的Text-to-SQL能力完全能夠勝任。

累積效應

SAG讓每一次檢索都更精準，這也帶來了顯著的累積效應。

以往大家覺得RAG的多跳效果一般，本質上是因為”Garbage In, Garbage Out“——首次檢索質量不高，再多輪也起不了太大作用。

而SAG顯著提升了每一次原子檢索的質量，為LLM提供了更多關聯事件，多輪推理的效果也會有質的飛躍。

企業的應用

SAG的本質是利用AI將非結構化數據轉化為結構化數據，這在企業場景中蘊含著巨大的應用潛力。

首先，作為企業智能決策助手。

就像我們的首款產品Zleap-D1 Agent一體機，SAG能夠喚醒企業沉睡的歷史數據，實時連接最新業務數據，通過報告、搜索、問答等應用形態，為管理者提供決策輔助和全新的商業洞察。

其次，作為通用數據處理引擎。

SAG可以作為獨立的數據處理器，重構企業現有的所有數據。無論是電商推薦、金融風控，還是廣告投放，都能從中獲益——用更智能的數據顯著提升原有算法的效果。

最后，作為低成本的AI轉型方案。

SAG能夠幫助傳統企業跨越信息化階段，直接邁入AI化時代。SAG通過AI將繁雜的非結構化信息轉化為統一的數據格式，為更深層的應用場景奠定了堅實的數據基礎，有望加速整個toB應用生態的發展。而且SAG的數據處理是異步進行的，不僅可以使用小模型，還可以利用起夜間的閑置算力，讓企業以更低的門檻處理海量歷史數據，真正邁入AI時代。

個人的應用

SAG在個人應用方向同樣前景廣闊。

首先，作為個人知識庫的底座。SAG可以讓你的筆記、文檔、收藏真正變成可檢索、可關聯的知識體系，而不只是一堆躺在文件夾里的信息。

其次，作為個人AI的記憶中樞。讓AI更好的記住你的偏好、習慣、歷史對話，真正成為懂你的智能助手。

更重要的是，SAG足夠輕量。由于對算力需求極低，經過精簡的系統甚至可以完全離線運行在手機上，效果依然出色——你的數據永遠在你自己手里。

Agent的應用

對于Agent來說，上下文工程已經成為Agent開發的核心共識，但現有的上下文檢索往往過于粗暴。比如Claude Code的grep搜索，只能做正則匹配，缺乏深層次的結構化理解。

而SAG可以成為未來Agent的記憶與數據基座，快速為Agent提供更精準、更優質的上下文。就像前面提到的累積效應——在更好的上下文加持下，原本需要10步才能完成的任務，可能3步就能搞定，大幅提升Agent的運行效率和成功率。

開源

總的來說，SAG是新一代的RAG技術，融合SQL與向量的優勢，實現了快速、準確、全面的AI檢索，為企業、個人和Agent領域提供了更強大的數據基座。

為了可以讓所有企業都可以使用到SAG技術，也希望為行業發展貢獻一份力量，我們決定將這個技術開源：

https://github.com/Zleap-AI/SAG

本次由于篇幅問題，其實有的非常多的細節并沒有講，比如事件和屬性通過具體什么算法進行動態關聯，又比如多輪召回時的動態剪枝策略等等，關于更具體的算法和原理，請查看我們的開源代碼。也歡迎有興趣的企業和高校與我們合作探索。

總結

我們認為，SAG的價值遠不止于替代RAG——它更大的意義在于，能以極高效率將各種信息轉化為統一的多維知識圖譜。設想這樣一個未來：SAG通過一個簡潔優雅的數據格式，打通所有信息源，讓數據不再是孤島，而是可以互相連接甚至交易的資產。而這些海量的結構化數據，又可以被AI充分檢索和利用，推動整個社會生產效率的躍升。

這就是我們智躍Zleap的愿景：讓所有信息產生連接，讓所有數據成為資產。

為了大家更方便地體驗這個技術的能力，我們也為普通用戶做了一個產品，可以將公共信息和私人信息聚合在一起，定時生成報告，或進行問答和搜索。

由于產品仍處于Beta階段，我們實施了邀請碼機制。邀請碼將通過智躍公眾號定期發布，感謝您的關注。

Web：https://app.zleap.com.cn

APP：iOS App Store搜索Zleap

鷺羽

知名數學家辭職投身AI創業：老板是00后華人女生2025-12-06
Runway Gen-4.5刷屏發布，把重量塵土和光影都做對了，網友：顛覆2025-12-02
靈光 “一閃”，330萬個“閃應用”已創建2025-12-02
AI也會被DDL逼瘋！正經研究發現：壓力越大，AI越危險2025-12-01

Zleap技術解密：后RAG時代已來，SAG重新定義AI搜索

SQL驅動

自然語言向量

六度分隔理論

馴化不確定性

累積效應

企業的應用

個人的應用

Agent的應用

開源

總結

相關閱讀

首次引入GPT-4o！圖像自動評估新基準來啦

華人學者往Linux內核里提交bug，社區把整個明尼蘇達大學拉黑了

Mac專屬大模型框架來了！兩行代碼部署，能聊本地數據，還支持中文

OpenAI新生成模型開源炸場！比Diffusion更快更強，清華校友宋飏一作

傅利葉開源全尺寸人形機器人數據集，首批上線超3萬條真機數據

讓霉霉中文開口跪”的AI有開源平替了！每月立省350（doge）

熱門文章

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

寧德時代給9萬+基層員工漲了薪！每月150元

云計算一哥10分鐘發了25個新品！Kimi和MiniMax首次上桌

GPT5.5代號“蒜你狠”曝光！OpenAI拉響紅色警報加班趕制新模型，最快下周就發

Zleap技術解密：后RAG時代已來，SAG重新定義AI搜索

SQL驅動

自然語言向量

六度分隔理論

馴化不確定性

累積效應

企業的應用

個人的應用

Agent的應用

開源

總結

相關閱讀

首次引入GPT-4o！圖像自動評估新基準來啦

華人學者往Linux內核里提交bug，社區把整個明尼蘇達大學拉黑了

Mac專屬大模型框架來了！兩行代碼部署，能聊本地數據，還支持中文

OpenAI新生成模型開源炸場！比Diffusion更快更強，清華校友宋飏一作

傅利葉開源全尺寸人形機器人數據集，首批上線超3萬條真機數據

讓霉霉中文開口跪”的AI有開源平替了！每月立省350（doge）

熱門文章

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創 語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

寧德時代給9萬+基層員工漲了薪！每月150元

云計算一哥10分鐘發了25個新品！Kimi和MiniMax首次上桌

GPT5.5代號“蒜你狠”曝光！OpenAI拉響紅色警報加班趕制新模型，最快下周就發

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式