是個公司都在用AI Agent,但大家真的用明白了嗎| MEET2026圓桌論壇
Agnet落地案例分享
編輯部 整理自 MEET2026
量子位 | 公眾號 QbitAI
“每個人每天使用最高頻的三個APP中有兩個是Agent時,才意味著AI Agent進入新發(fā)展階段。”
“一個好Agent的衡量指標,包括可控性、可解釋性以及持續(xù)穩(wěn)定執(zhí)行任務的能力。”
“多數(shù)Agent存在負毛利問題,完成任務的代價高于用戶支付意愿,這對創(chuàng)業(yè)者來說是巨大挑戰(zhàn)。”
……
在量子位MEET2026智能未來大會的圓桌環(huán)節(jié),三位來自產(chǎn)業(yè)一線的嘉賓圍繞AI Agent的革新進程展開深入討論。他們分別是:
- 聯(lián)匯科技CEO兼首席科學家趙天成博士
- 小宿科技聯(lián)合創(chuàng)始人兼CEO杜知恒先生
- 螞蟻集團平臺體驗技術部負責人徐達峰先生
2025年普遍被視為“Agent元年”。從客服、理賠等相對標準化的場景開始,Agent已經(jīng)完成了初步落地,并驗證了技術可行性與階段性價值。
但真正的難題才剛剛顯現(xiàn)——
如何讓Agent同時跑通技術、產(chǎn)品與商業(yè)三條曲線,形成可持續(xù)的正向閉環(huán),仍是擺在整個行業(yè)面前的共同挑戰(zhàn)。
而在這場圓桌討論中,三位嘉賓從產(chǎn)品形態(tài)、技術演進與商業(yè)現(xiàn)實等多個維度出發(fā),分享了他們對Agent下一程的判斷。
透過這些觀點,我們或可窺見Agent從技術概念走向規(guī)模應用的關鍵路徑,以及產(chǎn)業(yè)先行者們在探索中所面臨的思考與抉擇。

本次圓桌環(huán)節(jié)由量子位智庫首席分析師劉萌媛主持。在不改變原意的基礎上,本文對內(nèi)容進行了編輯整理。希望能夠給你帶來更多的啟發(fā)與思考。
MEET2026智能未來大會是由量子位主辦的行業(yè)峰會,近30位產(chǎn)業(yè)代表與會討論。線下到場參會觀眾近1500人,線上直播觀眾350萬+,獲得了主流媒體的廣泛關注與報道。
話題要點
- 目前在AI Agent及相關領域重點從事哪些工作?
- 各自落地效果最好的案例是什么?
- 真正好用的AI Agent產(chǎn)品應該關注哪些指標?
- 未來還有哪些對于AI Agent發(fā)展比較關鍵的卡點?
- AI Agent的下一步關鍵演進方向是什么?進入新階段的標志性節(jié)點是什么?
以下為圓桌對話全文:
圓桌實錄
量子位:
無論是在前面各位嘉賓的演講中,還是在整個2025年的討論里,相信大家已經(jīng)多次聽到“AI Agent”這一關鍵詞。
無論是技術迭代還是產(chǎn)品涌現(xiàn),AI Agent確實屢屢讓人眼前一亮。今天,我們將從更加理性、務實的角度來探討:千行百業(yè)距離廣泛應用AI Agent究竟還有多遠?
為此,我們邀請到三位嘉賓,他們分別代表AI Agent產(chǎn)業(yè)鏈上不同領域的最前沿產(chǎn)品與技術,來為大家?guī)砬袑嵉姆窒怼?/p>
首先,請三位嘉賓簡要介紹一下自己,以及目前在AI Agent相關領域所從事的工作。
趙天成:
大家好,我是來自聯(lián)匯科技的趙天成。在過去的五年里,我們團隊一直在做的事情是:
第一,研發(fā)信號終端側的多模態(tài)模型;
第二,探索如何讓智能體從在虛擬世界做PPT、寫寫畫畫,走向物理世界,真正操控終端設備,也就是實現(xiàn)所謂的“物理智能體”。
目前我們在兩個方向做了很多工作,一是致力于讓多模態(tài)智能體本地化運行,不完全依賴云端強大算力。例如,讓它在端側設備(如AI PC)上,甚至在飛機等無網(wǎng)絡環(huán)境中,也能高效處理海量多模態(tài)數(shù)據(jù),并轉化為真正實用、能幫用戶解決實際問題的智能體。
更進一步,我們致力于將無人機、機器人、攝像頭等具備真正執(zhí)行能力的智能終端串聯(lián)起來,形成協(xié)同工作的智能體網(wǎng)絡。這是一個非常有意思的課題。目前大家熟悉的智能體,或許更多體現(xiàn)在處理工作流或特定查詢場景中。而我們探索的是更系統(tǒng)的物理聯(lián)動。
舉個例子,一個智能攝像頭探測到火災,它可以自動通知另一個終端——比如一臺配備滅火裝置的機器狗。機器狗收到指令后前往現(xiàn)場撲滅火情,并在任務完成后返回基地,自動生成一份報告給管理員,說明“火災已發(fā)生并被撲滅,問題已解決”。
這樣一個從感知、決策、執(zhí)行到反饋的完整閉環(huán),能否通過智能體流暢地串聯(lián)與調(diào)度,從而實現(xiàn)智能體從數(shù)字世界走向物理世界的跨越?這正是我們團隊過去兩年來持續(xù)深耕的核心方向。

徐達峰:
大家好,我是來自螞蟻平臺體驗技術團隊的徐達峰。我們目前主要聚焦在兩個方向:
一是重構軟件的研發(fā)方式。我們正在構建一套完整的智能研發(fā)體系——WeaveFox,其中包含WeaveFox-Coder、Vibe-Coding、Spec-Coding等模塊,并打造了面向工程體系的Coding-Agent基礎設施和軟件工程-Agent基礎設施。
我們的核心目標,不僅僅是“讓模型能夠寫代碼”,更是要將多模態(tài)生成代碼、任務自動拆解、工具鏈智能協(xié)同等能力,真正融入到生產(chǎn)環(huán)境中。我們致力于讓AI從輔助工具,轉變?yōu)檠邪l(fā)體系的原生能力,從而推動整個工程鏈路實現(xiàn)更高水平的自動化。
二是致力于將多智能體能力帶給大眾用戶。
為此,我們推出了“螞蟻百寶箱”以及“百寶箱超級智能體”。我們的愿景是將其打造成一個“通用Agent平臺”——無需任何代碼依賴,也不要求使用者具備技術背景,真正做到開箱即用。用戶只需用自然語言描述需求,就能輕松構建并發(fā)布屬于自己的智能體應用。
無論是內(nèi)容創(chuàng)作類的需求,如生成文案、制作PPT、撰寫報告、設計網(wǎng)頁,還是通過多Agent協(xié)作完成更復雜的工作流任務,都可以通過這個平臺實現(xiàn)。我們的目標,是將AI智能體從高門檻的“專業(yè)工具”,轉變?yōu)槿巳硕寄苡闷饋淼摹肮ぞ呦洹薄?/p>

杜知恒:
我是杜知恒,小宿科技打造的是面向Agent的一站式基礎設施平臺。
我們認為,其中尤為重要的一個產(chǎn)品是為Agent設計的搜索引擎。這里我們也呼應一下螞蟻的觀點:我們相信,優(yōu)秀的Agent能夠勝任人類可以完成的工作。
過去,搜索引擎和信息獲取一直是人們工作、學習乃至日常生活中最主要的信息獲取工具。我們提供的正是一個多語言、全球化的搜索引擎工具,專門服務于Agent。
除了搜索能力,我們還提供模型服務、AI沙盒等多樣化的Agent工具集,致力于為大家打造一站式的Agent Infra平臺。
各自落地效果最好的案例是什么?
量子位:
在三位做的Agent相關的產(chǎn)品里面,效果最好的Agent落地案例是什么?能否結合具體數(shù)據(jù)和觀眾分享一下,讓大家對Agent落地價值有更直觀的感受?
趙天成:
今年有兩個點帶來的ROI(投資回報率)提升還是非常明顯的。
第一個是有了多模態(tài)。今年的確是VLM(視覺語言大模型)大幅度成熟的一年,之前大家用ChatGPT、GPT-4比較多,今年GPT-4o、Gemini 3這些新出來的多模態(tài)模型對于圖像和視頻的理解能力其實有質(zhì)的飛躍。
有了這個能力之后,我們的智能體可以算是打開了新的窗戶。之前Agent只能處理文本,要做圖片任務還需要一段描述,再給到模型去理解執(zhí)行,現(xiàn)在有了端到端模型之后,直接給視頻、給掃描件、給一張圖片甚至混合在一起都可以直接做(任務),很多以前不敢想的場景瞬間打開。
我們在多模態(tài)領域扎根很久,之前就在做很多探索,今年的確感受到建模本身的提升,多模態(tài)能力可以讓我們的智能體即使在數(shù)字空間場景中,也可以做很多以前不可能做到的事情。
第二個是有了執(zhí)行智能體。以前的AI即使可以理解視頻、理解圖像,也只能給你一個提醒“這邊發(fā)生事故趕快修復”、“這邊有問題趕快派人去吧”,現(xiàn)在有了執(zhí)行智能體,無論是操控機械臂還是執(zhí)行其他操作,現(xiàn)場就能直接解決問題。
這對于用戶來說,投資回報率和價值完全不在一個量級,比如以前一個終端最多付一千塊錢,有了智能執(zhí)行端之后愿意付十萬塊錢,這是一百倍的本身價值的提升。
智能體核心邏輯在于結果即服務,提供的是一個結果,這個結果的價值定義了產(chǎn)品有多大的能力邊界,一個是幫你看著,提醒你趕快滅火吧;第二個是直接告訴你已經(jīng)幫你把火撲滅了,比人撲的更快一些,這個對客戶來說價值是100倍的提升,這也是為什么我們非常篤定地相信多模態(tài)+執(zhí)行是智能體在后續(xù)發(fā)展中非常重要的板塊和體現(xiàn)。
杜知恒:
過去這一年Agent進化還是很明顯的,從大家只會用Chatbot到真正開始用AI做各種各樣的任務、工作,包括陪伴式的娛樂、學習。
我觀察到在這幾個場景中,Agent能做越來越多智能化的工作。
第一個就是剛才說的做PPT、寫產(chǎn)品文檔,包括Coding,在核心工作流中Agent開始能交付實習生水平的結果,這是過去一年中Agent領域非常明顯的進步和進化。
另外可以看到,各種各樣的垂類軟件正在越來越多地采用AI技術,無論是客服系統(tǒng)、數(shù)據(jù)平臺還是其他各類軟件工具。我的觀察是,上一代SaaS公司正在快速引入AI能力,這顯著提升了它們服務客戶的效率與質(zhì)量。
徐達峰:
前面老師提到智能客服,還有端到端多模態(tài)+執(zhí)行,我補充一個Coding Agent能力方面的個人觀察。
Coding Agent已經(jīng)從寫一段代碼進化為跑一段流程。在WeaveFox的實踐中,Agent能看懂設計稿、理解上下文和組件規(guī)范,然后自動生成可上線代碼。過去通常需要工程師在IDE中花半天時間調(diào)試,現(xiàn)在Agent幾十秒就能跑完。而且這是在多個規(guī)模化項目里,我們穩(wěn)定看到了3~5倍的效率提升。
這說明,只要工具鏈和上下文足夠清晰,Agent的能力是可以被“工程化復制”的。
真正好用的AI Agent產(chǎn)品應該關注哪些指標?
量子位:
今天邀請到的三位嘉賓在AI Agent里面處于不同的生態(tài)位,小宿處于基礎設施層,另外兩位老師偏向于產(chǎn)品層,請各位在不同的生態(tài)位上定義真的好用、或者有價值的AI Agent產(chǎn)品,你們覺得現(xiàn)在更應該關注哪些指標?有哪些指標大家沒有關注?下一步應該在哪些方面投入更多技術和精力呢?
杜知恒:
我的觀點還是一樣的,(如果AI)能更像人一樣,交付一個從高中生到大學生到博士生能交付的結果,這就是好場景。
企業(yè)愿意為這類AI支付更高成本,背后的邏輯很明確:過去,大家把AI當作普通軟件看待,關注點局限在軟件訂閱費的高低;而現(xiàn)在,大家會將其價值與實習生、全職員工的人力價值做對比。
即便目前存在堆砌Token完成任務的爭議,包括我們公司在內(nèi),許多企業(yè)在高頻使用AI進行代碼編寫(Coding)、撰寫產(chǎn)品需求文檔(PRD)、搭建各類工作流以優(yōu)化效率的過程中,通過AI節(jié)省的人工成本,也遠遠超過了在Token上投入的費用,即使Claude Code很貴。
我覺得我們內(nèi)部對Agent可用性最主要的評判標準,就是它能不能在特定場景交付一個相對完整的結果。
Agent在中國被叫智能體,但其實我覺得“代理人”這個翻譯是更好的,一個Agent不能給你交付結果,你肯定不會花錢雇他,包括Coding這些場景在內(nèi),AI越來越能夠真正交付結果。
現(xiàn)在Coding還有抽卡的情況,但即使是抽卡抽三次性價比依然很高。
趙天成:
我們從時間上來看,有兩方面是整個業(yè)界要慢慢接受和改變的,因為智能體跟以前信息化系統(tǒng)和純粹軟件還是不太一樣的。
第一個是之前很多人說做AI原生的Agent,我們發(fā)現(xiàn)以前軟件系統(tǒng)有很多UI式、表單式結構,很多時候AI就是把表單的某些環(huán)節(jié)換成模型,這是比較方便的方式,但也有很多時候換湯不換藥,還是原來的工作流做的事情。
其實可以把一個環(huán)節(jié)徹底用Agent代替,這時候可能會有一些更加創(chuàng)新型的產(chǎn)品并落地應用,這樣才真正能把智能體的優(yōu)勢發(fā)揮出來,而不是受限于很條條框框的地方,只能做以前一些環(huán)節(jié)的替代。大家(才)會接受智能體可以真正替代一個流程一個環(huán)節(jié),真正用AI的方式做這個事情。
第二個是Agent本身是可以進化的,在以往的AI應用中,包括我們的不少甲方客戶在內(nèi),很多人會陷入一種認知誤區(qū):認為采購AI本質(zhì)上就是采購一套算法,并且對算法的準確率、召回率有明確要求,若初始階段無法達到既定指標,就不會驗收。
但實際上,Agent的價值體現(xiàn)在實際應用過程中,Context(上下文信息)會不斷豐富,它自身具備記憶能力,再結合用戶給出的反饋,會逐漸熟悉用戶的業(yè)務流程,最終真正幫用戶解決實際問題。然而當前許多場景下,用戶并不能接受這種漸進式優(yōu)化的模式,他們往往期望一步到位,要求AI在初始階段就達到95%的準確率。
這就陷入了“雞生蛋還是蛋生雞”的矛盾問題。如果用戶不使用AI、不提供反饋、不補充Context,不給AI學習和適應的機會,AI自然無法達到理想的使用效果;可用戶又因AI初始效果未達預期而不愿啟用,形成了惡性循環(huán)。
不過這種情況也在逐漸改變,越來越多人也正在接受,說明大家用豆包、用GPT,已經(jīng)習慣了越聊越聰明的交互模式,慢慢(把它)變成自己想要的數(shù)字員工。
這個可進化性也是我們內(nèi)部衡量智能體的非常重要的指標。假如一個智能體做出來就是這樣了,你再跟它聊它都不會有變化,那就不是好的智能體,如果通過一天、一周、一個月使用變得更加個性化了,就是好的智能體。
量子位:
我想再追問一下趙總,您剛剛提到用Agent徹底替代某一部分工作流,或者某一部分工作場景,那讓你暢想一下在未來6個月或者一年之內(nèi),您覺得會有哪些行業(yè)或者場景率先有可能被徹底改變工作流呢?
趙天成:
假如是6個月的時間,在那些失敗結果沒有那么災難性的地方,相關問題或許可以得到徹底解決。(這些場景的容錯空間相對較大),AI一次沒做好,大不了再做一次,而且如果做三次的成本,比我自己干整個過程的成本還是低很多,那這類工作就可以被替換掉。
量子位:
也就是說結果不夠致命,有一點容錯空間的任務基本可以實現(xiàn)AI替代人。
那么徐總,螞蟻目前在做的這些產(chǎn)品,包括您剛才提到的Coding Agent,以及面向群眾的產(chǎn)品,從您的角度來說,一款AI Agent產(chǎn)品最值得關注的指標是什么呢?
徐達峰:
在我看來,判斷一款Agent是否優(yōu)秀,可以從以下幾個角度界定標準,比如可控性、可解釋性,乃至于穩(wěn)定性,這是基礎要求,在此就不贅述了。
需要明確的是,Agent一定是基于某一類特定任務去設計的,很多場景里,任務本身就是開放型問題、還存在各種例外情況,模型也不可能100%完美解決所有問題。所以我認為優(yōu)秀的標準是看Agent產(chǎn)品有沒有設計人機協(xié)作的流程。
企業(yè)真正需要的不是“永不犯錯”,而是犯錯時能暴露不確定性,是否具有回滾的能力,能不能回溯回去找到問題。另外在這個過程中,在出現(xiàn)問題后,能順暢地將任務交由人工接管。
也就是說,它要像一位可靠的同事,而不是像一名(缺乏協(xié)作性的)天才小學生。如果沒有如上指標,即便效果再驚艷,也很難真正落地,我覺得這是一個好的Agent的標準指標。
量子位:
如果把剛剛給趙總的問題再拋給您,目前您涉及的所有用戶場景里,未來6個月,您覺得哪一個是被改寫最徹底的?
徐達峰:
徹底不敢談。我認為軟件工程可能仍會面臨較大的沖擊和變革。
這主要是因為其工具鏈相對成熟,有上一代數(shù)字基建作為基礎,且任務本身偏向結構化。
同時,進一步自動化的收益非常高。這些因素共同作用,將推動整個流程越來越自動化,通過輔助編碼和自動化流程,研發(fā)團隊也會更容易接受。因此,我認為是軟件工程。
量子位:
我們把這個問題換一個方向問杜總,您作為基礎設施層的代表,您認為基礎設施層究竟是如何影響不同AI Agent產(chǎn)品最終呈現(xiàn)的任務水平呢?能否結合小宿或其他具體案例,為我們解析一下具體的影響鏈路?
杜知恒:
其實我們很難直接影響到Agent本身,更多是客戶基于自身場景對基礎設施提出更高要求,我們?nèi)ロ憫蜐M足。
回到搜索本身,從ToC時代到ToAgent時代,三十年來它的核心標準——相關性、權威性、時效性,本質(zhì)上沒有改變。變化的是這些標準的重要程度。
過去,用戶搜索時前三條結果必須吸引點擊,所以相關性是最重要的指標。(但僅有相關性還不夠)即使內(nèi)容相關但質(zhì)量很差,排到前面用戶接受的概率,也比展示不相關信息要低得多。
但對于AI而言,調(diào)用搜索的核心原因在于消除信息幻覺與獲取時效內(nèi)容。
對AI Agent來說,搜索的首要要求是權威性——信息必須準確、全面。即便在前十條結果中,哪怕極端情況下有兩條不相關,也遠比“十條看似相關、卻缺乏精準性和時效性的信息”要好,后者帶來的后果反而更加災難性。
未來還有哪些對于AI Agent發(fā)展比較關鍵的卡點?
量子位:
我們剛剛幾個問題都聊的是Agent今天有怎么樣的成就和價值,那我們現(xiàn)在從批判的角度聊一聊。
首先想問一下,從各位的角度來看,除了現(xiàn)在常說的推理大模型,或者語言大模型,還有哪些對于AI Agent未來發(fā)展比較關鍵的卡點?
既可以是技術方面,也可以是生態(tài)運營方面的,不知道各位是怎么看待這個問題的?
趙天成:
我最近比較關注的是智能體的雙腦架構。
剛才提到的代碼生成這些創(chuàng)新都是用大語言模型做快速的處理,但是到我們這種物理場景之后,有時候你逃不掉,必須做雙腦架構。
什么叫雙腦?比如大語言模型給出一個指令,說無人機幾點幾分到這個地方去,但是在飛行過程中怎么飛?假如還是依賴云端語言模型思考的話,這個飛機干脆不要飛了,每飛5米就要想一想再飛一下,不太現(xiàn)實。
所以必須在端側要有快速的、類似于小腦的模型做飛行這一塊的執(zhí)行,這個就跟常規(guī)的MCP模式還不太一樣,以往云端模型調(diào)用工具,可能只是完成一次搜索、查詢或簡單指令下發(fā);但在雙腦架構里,云端大腦調(diào)用的不是普通工具,而是要驅動端側小腦模型,讓它把飛機飛過去。
這其實和目前主流智能體架構有區(qū)別,跟學術界研究的問題也不太一樣。這里面得有一個框架,方便把各種小腦和大腦集成在一起,真正形成一個指揮官和類似于行動單元的組合的形態(tài)。
這個是我們近期一直在看的點,因為現(xiàn)在的確碰到了這樣的現(xiàn)實問題,而且需要解決這些問題。
徐達峰:
我可以補充一個企業(yè)視角下的觀點,Agent如果要在企業(yè)中落地,可能還會有一些挑戰(zhàn)。尤其是大規(guī)模用在企業(yè)端時,首當其沖的可能是會面臨訪問核心資產(chǎn)數(shù)據(jù),以及隱私和安全審計問題。
怎么樣能夠讓這樣的Agent可以被安全地運行?它訪問數(shù)據(jù)是否有權限?能不能被審計?這些都是關鍵命題。
以往很多流程設計更多是針對常規(guī)系統(tǒng)和人類操作場景設計的,很少有為Agent設計的,這是很關鍵的基礎設施的缺漏。這樣的安全基礎設施建立起來之后,才可能會為Agent大規(guī)模落地鋪好前提。
面向Agent的設計,很可能是權限體系的重新設計和重塑。
杜知恒:
我也說一個非常現(xiàn)實的問題,我們看Agent,特別是ToC的Agent最大的挑戰(zhàn)就是成本和ROI的問題。
因為即使當下的Agent可以幫你完成一些任務,但其實它完成任務所付出的代價和用戶愿意付的成本還是有一個很明顯的差距,目前市場上絕大多數(shù)的Agent都是以負毛利在運營,這在長期看來是一個很大的挑戰(zhàn),因為你很難在一個負毛利商業(yè)模式下做大規(guī)模的用戶滲透。
除非像螞蟻、字節(jié)這樣的巨頭,可以為獲取客戶長期承擔非常大規(guī)模的虧損,這個對于大部分的Agent創(chuàng)業(yè)者來說可能也是一個挑戰(zhàn)。所以核心問題就是怎么能把商業(yè)模式跑通,能夠把用掉的Token和工具的錢賺回來?
對于一個基礎設施提供方來說,對客戶健康度的判斷很重要,如果我的客戶都很賺錢,那我大概率收取的價格是比較合理且可持續(xù)的,如果所有人都在虧錢,或者說大家都是期待下一輪的融資再來付今天用的基礎設施的錢,(那么整個生態(tài)的健康度就會存疑),對于我們來說也非常關心這個問題。
量子位:
有關產(chǎn)品線的ROI,也想再問一下徐總,您剛剛提到咱們有做一些面向大眾普惠型的產(chǎn)品,像剛剛提到收費方面的問題,會不會從您的角度來看,為了讓大眾使用AI Agent的產(chǎn)品,除了技術上要達成一些目標,是不是還有其他的要素也需要注意的?
徐達峰:
說一點個人的粗淺判斷。
首先,使用門檻在產(chǎn)品設計上必須足夠低,不能預設用戶具備專業(yè)知識背景,更不能假定他們本身就懂代碼。現(xiàn)實中,這樣的前提不太可能成立。
其次,更高頻的使用場景,可能集中在文案、PPT等內(nèi)容創(chuàng)作上,其本質(zhì)是信息的聚合、創(chuàng)作過程的協(xié)助,以及后續(xù)內(nèi)容排版等工作。這類場景天然更適合大眾用戶。
此外,還會出現(xiàn)許多新的特色玩法。比如螞蟻最近發(fā)布的“靈光”產(chǎn)品,就是一款很有意思的App,用戶可以用它制作小游戲、小應用,實用性很強。大致會是這類產(chǎn)品設計方向。
Agent的下一步關鍵演進方向是什么?
量子位:
眾所周知,2025年已被視為AI Agent的元年。那么,元年之后下一個關鍵的演進方向是什么?剛才趙總提到了“雙端”和“多模態(tài)”,我們想請各位具體展望一下,對于Agent而言,下一步的關鍵方向是什么?
趙天成:
雖然2025年被稱為“智能體元年”,但可能現(xiàn)實生活中還沒有那么多智能體。今年更像是iPhone 1的階段,距離真正成熟、普及的iPhone 4,還有很多要做的事情。
就我個人在C端的使用體驗而言,日常可能會用一個類似豆包的智能體,來替代部分搜索類工作,我覺得已經(jīng)達到了“可用”的水平。但如果是下一輪融資的PPT,讓智能體來完成,即便是現(xiàn)在最好的智能體也做不到,這仍然需要我自己完成大量策略層面的思考,才能有比較好的結果。
所以在我看來,即使是目前定義已經(jīng)相當成熟的智能體,在可靠性和實際效果上,依然有大量提升空間。
這種提升可能來自基礎模型能力的增強,也可能來自工程化能力的改進,也可能正如前面幾位所提到的,是多個層面的共同進步。
只有這些條件都到位,智能體才能真正把哪怕是“做PPT”這樣看似簡單的功能,提升到一個全民都能夠使用的水平——這是第一個方面。
第二個方面,是我們自己正在做的事情。我們一直相信,如果未來的AI只停留在替代一部分數(shù)字化工作,那一定是不夠的。它最終必須能夠替代部分藍領工作,走向現(xiàn)實世界,幫我們在物理世界干活。
(而要實現(xiàn)這一點),需要解決的問題依然非常多,包括前面多位老師提到的VLA、世界模型等,這些很可能都是不可或缺的組成部分,只有在它們被有效拼合之后,智能體才有可能真正走向物理世界。
在這里有兩個關鍵問題。第一,未來是否會一直是“大語言模型+其他模型”的組合形式?短期來看大概率如此,但從長期看并不一定——完全有可能被一種全新的架構徹底取代,這并非不可能。其實早兩年我們看待大語言模型時,也曾覺得這條路徑不太可能,但現(xiàn)在它已經(jīng)成為主流。
第二,還是可靠性的問題。(當智能體進入物理世界),可靠性就變得更加嚴肅,不能說一下子把桌子砸了,那會是災難性的后果——在電腦里最多是誤刪文件,雖然也很嚴重,但相比之下還是要輕一些。
因此我認為,可靠性是所有智能體真正成為“每個人每天都在使用”的工具之前,必須解決的核心問題之一。
杜知恒:
我可能更多是從商業(yè)視角來看這個問題。對于2026年,我有幾個基本預期。
第一會是巨頭的大規(guī)模下場。
無論是在B端還是C端,都會出現(xiàn)真正意義上的重投入,去爭奪DAU、ARR和核心客戶。2025年我們已經(jīng)看到,超大規(guī)模投入主要來自字節(jié)的豆包,BAT其他幾家以及螞蟻更多是在下半年才逐漸發(fā)力。
我認為到明年,這一趨勢會變得非常清晰且激烈——所有Tier 1、Tier 2的傳統(tǒng)大型互聯(lián)網(wǎng)公司,都會在Agent方向上加大投入,圍繞“入口”展開競爭。
第二個預期也由此引出:在這種大規(guī)模投入的推動下,AI的整體滲透率會顯著提升。
包括現(xiàn)場各位的手機和電腦,其AI含量也都會大幅上升。頭部Agent會開始真正進入二線、三線城市,被非專業(yè)用戶廣泛使用,甚至包括我們父母這一代人,也會逐步開始接受和使用。
因此,在我看來,Agent的大規(guī)模滲透將是2026年我比較期待的事情。
徐達峰:
如果說未來一年的Agent的話,我可能會分幾個層次看。
第一層次是數(shù)據(jù)和算法,再上層是模型能力,可以看到,這兩層的技術能力呈現(xiàn)慢慢收斂的趨勢。第三層是Agent的框架,以及和系統(tǒng)交互和集成,無論是C端還是B端,都可以看到有更多的數(shù)據(jù)管控、權限管控、接入集成等多方面的實踐。
另外再往上延伸至產(chǎn)品側與行業(yè)應用層面。目前可以看到越來越明顯的趨勢。
除了能解決一些日常小工具類的任務,或者一些小型的效率場景,也可以看到有一些Killer App(現(xiàn)象級應用)出現(xiàn)。這類應用往往會錨定泛娛樂賽道,給用戶提供很多情緒價值,甚至慢慢App擴展到智能硬件上,這些是能看到的趨勢。
當然,也期待2026年這樣的趨勢逐步爆發(fā),可以給大家?guī)砀嗟腁I Agent在各行業(yè),各領域的體驗。
AI Agent進入新發(fā)展階段的標志節(jié)點
量子位:
最后一個問題,再替公眾朋友們試圖向三位嘉賓詢問一下不確定中的確定性。
像剛剛提到,不管是從技術需要的基礎設施,還是未來的產(chǎn)品形態(tài),其實都有可能還有很多新的內(nèi)容出現(xiàn)。
如果從三位嘉賓的角度來看,有沒有哪個節(jié)點是你們覺得如果看到了就意味著AI Agent已經(jīng)進入新的發(fā)展階段了,不是像現(xiàn)在這樣只是從無到有,而是真正徹底改寫,而且普惠大眾的,有沒有哪個標志性的節(jié)點是各位現(xiàn)在最期待的?
杜知恒:
可能是我媽媽開始用Manus開始畫PPT或者做一個什么事情的時候開始。
我覺得當前Agent的滲透率雖然看起來如火如荼,但是在三、四線城市和人們?nèi)粘I钪羞€是一個超級低的狀態(tài)。
可能我自己的觀察指標是身邊的年長,或者非技術行業(yè)的人真正開始在用一些Agent,改變他的生活方式,或者提升他的生活體驗。
趙天成:
我覺得就是當你每天最高頻使用的三個APP里面有兩個是Agent,到那天可能就差不多了。
徐達峰:
我比較贊同趙天成老師的看法,如果你每天用的軟件都已經(jīng)是Agent,那就已經(jīng)產(chǎn)生質(zhì)變了。
量子位:
確實,今年我們看到很多Agent產(chǎn)品出現(xiàn),無論是現(xiàn)場和線上的觀眾可以多去嘗試嘗試不斷出現(xiàn)的新的Agent產(chǎn)品,看這些產(chǎn)品能不能帶來一些新的收獲和新的價值。
再次感謝三位嘉賓今天來到圓桌,跟我們從一線視角聊一聊AI Agent還需要進步的地方,以及現(xiàn)在明確能夠帶給我們的價值,謝謝大家。
- ChatGPT文風,原產(chǎn)地肯尼亞2025-12-17
- 跳過“逐字生成”!螞蟻集團趙俊博:擴散模型讓我們能直接修改Token | MEET20262025-12-12
- 馬斯克猛猛帶貨太空數(shù)據(jù)中心!“能耗比地球香太多”2025-12-15
- 10億美元OpenAI股權兌換迪士尼版權!米老鼠救Sora來了2025-12-12




