色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

阿里智能體多輪推理超越GPT-4o,開源模型也能做Deep Research

自主信息檢索智能體WebDancer

WebDancer團隊 投稿
量子位 | 公眾號 QbitAI

能夠完成多步信息檢索任務,涵蓋多輪推理與連續動作執行的智能體來了。

通義實驗室推出WebWalker(ACL2025)續作自主信息檢索智能體WebDancer。

WebDancer 通過系統化的訓練范式——涵蓋從數據構建到算法設計的全流程——為構建具備長期信息檢索能力的智能體提供了明確路徑。

同時,該框架也為在開源模型上復現Deep Research系統提供了可行的指導。團隊將進一步在更開放的環境中、結合更多工具,持續拓展和集成Agentic能力,推動通用智能體的落地與演進。

阿里智能體多輪推理超越GPT-4o,開源模型也能做Deep Research

一、背景:信息檢索的新需求與挑戰

在信息爆炸的時代,傳統的搜索引擎已難以滿足用戶對深層次、多步驟信息獲取的需求。從醫學研究到科技創新,從商業決策到學術探索,復雜問題的解決需要深入的信息挖掘和多步推理能力。這催生了對能夠自主思考、自主決策的智能體的需求。

然而,構建這樣的智能體面臨諸多挑戰:

  • 理解復雜網頁內容:
  • 智能體需要具備解析和理解多樣化網頁結構和內容的能力。
  • 多步決策與推理:
  • 能夠進行任務分解、知識回溯和反復驗證,完成復雜的信息檢索任務。
  • 適應開放動態環境:
  • 面對不斷變化的網絡環境,智能體需要具備強大的適應能力。
  • 自主行動:
  • 智能體應能自主采取行動并進行自我修正。

二、突破訓練數據難獲得問題

在自主信息檢索領域,高質量的訓練數據至關重要。然而,現有的數據集如2WIKI,HotpotQA多為淺層次問題,難以支持復雜多步推理的訓練需求。

為解決數據稀缺問題,WebDancer提出了兩種創新的數據合成方法:

  • CRAWLQA:通過模擬人類瀏覽行為,從權威網站(如arXiv、GitHub、Wikipedia等)中爬取網頁信息,生成復雜的問答對,確保數據的多樣性和真實性。這一技術方案與中稿在ACL2025的WebWalker類似。
  • E2HQA:采用“由簡到難”的策略,從簡單問題出發,逐步增加問題的復雜度,構建多步推理的問答對,促進智能體能力的逐步進化。為了保證QA對的合法驗證保持答案不變,對問題進行改寫。

ReAct框架與思維鏈蒸餾

ReAct框架是WebDancer 的基礎。一個ReAct軌跡包含多個思考-行動-觀察 (Thought-Action-Observation) 循環。智能體生成Thought(自由形式的思考),Action(結構化的行動,用于與環境工具互動),并接收Observation(來自環境的反饋)。這個過程迭代進行,直到任務完成,最終行動是 answer。可能的行動包括search,visit和answer。

思考鏈 (Chain-of-Thought, CoT) 對于智能體的執行至關重要,它使得高層工作流規劃、自我反思、信息提取和行動規劃成為可能。

論文探索了構建短CoT和長CoT的方法。對于短CoT,直接使用強大的模型(如 GPT-4o)在ReAct框架下生成軌跡。對于長CoT,則順序地向推理模型 (LRM) 提供歷史行動和觀察,讓其自主決定下一步行動,并記錄其中間推理過程作為當前的Thought。

在獲得問答對后,WebDancer利用ReAct框架,結合閉源的GPT-4o和開源的QwQ模型,進行長短思維鏈的蒸餾,生成高質量的agentic數據。這種方式簡潔高效,滿足了對Agentic Model的需求。

數據過濾與質量提升

為了確保數據質量,WebDancer采用了多階段的數據過濾策略:

  • 有效性控制:
  • 剔除不符合指令的數據。
  • 正確性驗證:
  • 僅保留結果正確的數據。
  • 質量評估:
  • 通過規則過濾掉出現嚴重repetition或思考冗余的數據,確保數據的多樣性和邏輯性。

這些嚴格的過濾策略,確保了訓練數據的高質量,為智能體的高效學習提供了保障。

阿里智能體多輪推理超越GPT-4o,開源模型也能做Deep Research

三、解決開放網絡環境難訓練

在開放環境中訓練智能體是一項極具挑戰性的任務。網絡環境的動態變化和部分可觀測性,使得智能體需要具備強大的適應能力和泛化能力。

為應對這些挑戰,WebDancer采用了兩階段的訓練策略:

  • 監督微調(SFT)
  • 在高質量軌跡數據上進行微調,使智能體快速適應任務需求,掌握在復雜環境中進行推理和決策的能力。為了避免外部反饋(Observation)的干擾,損失函數會屏蔽掉 Observation 的貢獻,只計算智能體自主決策步驟(Thought 和 Action)的損失。這已被證明能提高性能和魯棒性。
  • 強化學習(RL)
  • 通過與環境的交互,智能體不斷試錯,學習在復雜多變的環境中做出最優決策。WebDancer采用了先進的DAPO算法,動態采樣未被充分利用的數據對,提高數據效率和策略的魯棒性。DAPO 通過最大化一個目標函數來進行策略更新,該目標函數考慮了候選軌跡的獎勵和優勢項。優勢項基于批次內的原始獎勵值進行歸一化計算。

WebDancer通過動態采樣機制,優先采樣那些未被充分利用的數據對,確保數據的高效利用,增強了智能體的泛化能力。

強化學習階段的高計算成本和時間開銷一直是開放環境訓練的一大難題。WebDancer通過優化算法和硬件資源的高效利用,顯著降低了強化學習的成本。

阿里智能體多輪推理超越GPT-4o,開源模型也能做Deep Research

四、實驗與結果

WebDancer的創新策略在多個信息檢索基準測試中得到了充分驗證。

GAIA 數據集

GAIA數據集旨在評估通用人工智能助手在復雜信息檢索任務上的表現。WebDancer在GAIA數據集上的表現尤為突出,在不同難度的任務中均取得了高分,展現了其強大的泛化能力。

WebWalkerQA 數據集

WebWalkerQA數據集專注于深度網絡信息檢索。WebDancer在該數據集上的表現同樣出色,尤其是在中等難度和高難度任務中,其性能提升更為明顯。

阿里智能體多輪推理超越GPT-4o,開源模型也能做Deep Research

表現最佳的模型在GAIA基準測試中達到了61.1%的Pass@3分數,在WebWalkerQA基準測試中達到了54.6%的Pass@3分數。

BrowseComp 數據集

在更具挑戰性的BrowseComp(英文)和BrowseComp-zh(中文)數據集上,WebDancer同樣展現出了強大的性能,進一步證明了其在處理復雜信息檢索任務方面的魯棒性和有效性。

阿里智能體多輪推理超越GPT-4o,開源模型也能做Deep Research

五、深入分析:Agent模型的訓練

實驗一分析:

強化學習(RL)在提升普通指令模型(Instruction Model)性能方面表現顯著,尤其在提升Pass@1采樣準確率方面效果突出,其效果甚至可接近Pass@3。

然而,對于如QwQ這類以推理為核心的模型,RL的提升效果相對有限,主要體現在采樣結果的穩定性上。這一差異可能與agentic 任務中決策軌跡較長、推理過程更復雜有關。

阿里智能體多輪推理超越GPT-4o,開源模型也能做Deep Research

實驗二分析:

Agentic數據的質量遠比數量更為關鍵。

團隊在QwQ模型上僅使用約6000條高質量、具備長思維鏈的訓練數據,就在GAIA任務中取得了優異的效果,表明精細構造的思維軌跡在復雜任務中的價值遠高于海量但粗糙的數據。

阿里智能體多輪推理超越GPT-4o,開源模型也能做Deep Research

實驗三分析:

長短思維鏈的模式在不同類型模型之間并不具備良好的可遷移性。

盡管長思維鏈對指令模型和推理模型均能帶來性能提升,但其同時也顯著增加了非法生成(如重復內容)的概率,尤其在參數規模較小的模型上更為嚴重。這表明在設計長思維鏈訓練數據時,需要在有效性與體驗感之間做好平衡。

阿里智能體多輪推理超越GPT-4o,開源模型也能做Deep Research

六、未來展望

更多工具的集成

目前,WebDancer僅集成了兩種基本的信息檢索工具,未來計劃引入更多復雜的工具,如瀏覽器建模和Python沙盒環境,使智能體能夠執行更復雜的任務。

任務泛化與基準擴展

目前的實驗主要集中在短答案信息檢索任務上,未來WebDancer將擴展到開放域的長文本寫作任務,對智能體的推理能力和生成能力提出更高的要求。

在本研究中,致力于從頭訓練一個具備強大Agent能力的模型,重點探索如何在開源體系中構建高效的Agentic模型架構。這不僅有助于推動智能體模型的開源進程,也對于理解智能體在開放環境中如何涌現與擴展(scale)其能力具有基礎性意義。

采用原生的ReAct框架,強調簡潔性與通用性,體現了“大道至簡”的工程理念。所謂Agentic模型,指的是那些天生支持推理、決策及多步工具調用的基礎模型(foundation models)。能夠僅憑任務描述提示,即可展現出如規劃、自我反思、行動執行等一系列突現能力(emergent capabilities),從而在交互式環境中表現出近似智能體的行為。

近年來,系統如DeepSearch和DeepResearch顯示出強大底層模型如何作為智能體核心,通過其原生支持的工具調用與迭代式推理,完成自主的網絡環境交互。然而,考慮到網絡環境的動態性與部分可觀測性,強化學習(RL)在提升智能體的適應性與魯棒性方面起到了關鍵作用。

因此,團隊的目標是通過針對性的后訓練(post-training),在開源基礎模型中激發出更具通用性與自主性的Agent能力,從而為構建可持續、可控的智能體生態奠定基礎。

論文鏈接:https://arxiv.org/pdf/2505.22648
代碼鏈接:https://github.com/Alibaba-NLP/WebAgent

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
亚洲人成亚洲人成在线观看| 91精品福利在线一区二区三区 | 91丨九色丨蝌蚪丨老版| 色av中文字幕一区| 日韩激情小视频| 日韩色在线观看| 色噜噜一区二区三区| 日韩黄色精品视频| 国产女主播一区二区| 日韩精品一二三四区| 亚洲精品一区在线观看| 日韩精品丝袜在线| 日韩av一区二区在线| 视频一区中文字幕| 色诱av手机版| 国产最新免费视频| 日韩美女在线视频| 99热这里只有精品在线观看| 四虎免费在线观看| 蜜臀久久精品久久久用户群体| 久艹在线免费观看| 亚洲免费一级视频| 欧美天堂亚洲电影院在线播放| 国产精品久久久久久久久快鸭 | 国产大片一区二区| 一区二区三区影院| 国产亚洲一区字幕| 在线观看毛片网站| 亚洲图片综合网| 亚洲最大av网站| 国产精品1区二区.| 丰满的亚洲女人毛茸茸| 美女精品视频一区| 狠狠人妻久久久久久综合麻豆 | 国产女主播一区二区三区| 国产精品资源网| 91社区视频在线观看| 成人18视频免费69| 久久久噜噜噜www成人网| 日本一区二区三区视频在线观看| 国产一区再线| 丝袜美腿精品国产二区| 欧美videos中文字幕| 国产精品91一区| 亚洲三级在线观看视频| 久草视频在线免费| 韩国视频一区二区| 亚洲精品亚洲人成人网| k8久久久一区二区三区| 国产香蕉久久精品综合网| 日韩国产精品91| 久久亚洲成人av| 欧美福利第一页| 黄色片视频网站| 污污的视频网站在线观看| 美女mm1313爽爽久久久蜜臀| 奇米网一区二区| 国产ts变态重口人妖hd| 国产精品视频一二三| 久久久久久久久久国产| 国产中年熟女高潮大集合| 粉嫩av一区二区三区在线播放| 国产精品国产三级国产普通话三级| 亚洲视频在线观看一区| 91久久精品国产91性色tv| 欧美乱熟臀69xxxxxx| 久久综合久久美利坚合众国| 中文字幕在线观看精品| 亚洲成人福利视频| 亚洲欧洲免费无码| 亚洲综合小说区| 男人操女人免费| 国产男女免费视频| 欧美黑人又粗又大又爽免费| 国产成人在线免费视频| 91色porny在线视频| 精品久久久影院| 精品亚洲第一| 在线视频不卡一区二区| 国产成人一区二区三区别| 国产91视频一区| 久久久99爱| 91精品视频网站| 国产欧美久久久久| 国产无套粉嫩白浆内谢| 久久久精品性| 亚洲精品国产成人久久av盗摄| 国产在线播放一区| 在线视频日本亚洲性| 国产私拍一区| 日本午夜精品视频| 日本午夜精品视频在线观看| 精品久久无码中文字幕| 久久新电视剧免费观看| 91精品国产综合久久久久久久 | 色窝窝无码一区二区三区成人网站| 国产成人午夜99999| 欧美日韩美少妇| 福利一区二区在线观看| 精品日本一线二线三线不卡| 欧美日韩性视频| 亚洲精品伦理在线| 国语自产偷拍精品视频偷| 免费在线激情视频| 亚洲乱码国产乱码精品| 一区二区不卡在线视频 午夜欧美不卡在| 欧美黄色片在线观看| a√天堂在线观看| 亚洲天堂avav| 色噜噜狠狠一区二区三区果冻| 91夜夜揉人人捏人人添红杏| av女人的天堂| 久久精品一区二区三区四区| 美日韩在线视频| 久久久久久综合网| 国产一区视频在线看| 亚洲欧美三级在线| 人妻内射一区二区在线视频| 四虎免费在线观看| 亚洲国产天堂网精品网站| 久久久久久久免费视频| 超碰人人人人人人| 欧美日韩亚洲一区二| 国产精品一区二区欧美黑人喷潮水 | 蜜桃传媒视频第一区入口在线看| 欧美三级黄色大片| 亚洲视频精选在线| 欧美一区二区三区四区在线| 亚洲国产第一区| 久久久久9999亚洲精品| 国产精品久久久久久久美男| 男人舔女人下部高潮全视频| 国产精品久久久久国产精品日日| 国产日韩欧美综合| 国产一二三四在线| 91高清视频在线| 五月天在线免费视频| 人妻精品一区一区三区蜜桃91| 日韩成人av一区| 波多结衣在线观看| 不卡一区中文字幕| 国产精品中文字幕在线| 青青草精品在线视频| 色94色欧美sute亚洲线路一ni| 日韩高清国产精品| 欧美一区,二区| 久久久精品999| 女~淫辱の触手3d动漫| 亚洲免费观看高清完整版在线| 国产三级精品在线不卡| 国产一区二区三区在线观看 | 99草在线视频| 亚洲欧美激情精品一区二区| 欧美性猛交乱大交| 97久久精品人人做人人爽50路 | 欧洲色大大久久| 国内精品在线观看视频| 国产成人亚洲精品狼色在线| 国产精品综合久久久| 国产精品黄色网| 亚洲第一偷拍网| 人妻激情偷乱视频一区二区三区| 国产精品私人自拍| 日韩av电影免费在线| 高清乱码毛片入口| 欧美精品激情在线观看| 天堂久久精品忘忧草| 色爱区综合激月婷婷| 成人午夜视频免费在线观看| 972aa.com艺术欧美| 国产丝袜不卡| 秋霞电影网一区二区| 国产精品免费电影| 在线观看中文字幕av| 欧美成人三级视频网站| 日本三级网站在线观看| 亚洲香蕉成视频在线观看| 国产高清av片| 精品久久久久久中文字幕| 极品美女扒开粉嫩小泬| 久久久久久综合| 亚洲第一综合网站| 91色视频在线| 国产精品无码电影在线观看| 91在线小视频| 国产日韩三区| 精品一区精品二区高清| 国产精品有限公司| 精品一区二区三区香蕉蜜桃 | 亚洲不卡视频在线| 亚洲特黄一级片| 国产高清av在线播放| 国产精品久久福利| 人妻少妇被粗大爽9797pw| 亚洲欧美日韩一区| 亚洲成熟丰满熟妇高潮xxxxx| 中文字幕一区二区三区精华液| 欧美精品久久久久久久免费| 中日韩免费视频中文字幕| 人妻av无码专区| 中文字幕亚洲在| www.日本xxxx| 亚洲精品高清在线| 国产免费中文字幕| 婷婷久久综合九色综合伊人色| 冲田杏梨av在线| 欧美在线不卡视频| 中文字幕国产综合| 亚洲精品视频久久| 国产一级一片免费播放放a| 久久成人亚洲精品| 国产理论片在线观看| 成人中心免费视频| 国产在线国偷精品产拍免费yy | 一本色道久久88精品综合| 在线观看福利片| 日韩精品一区二区三区第95| 久久国产精品系列| 2019中文在线观看| 婷婷综合激情网| 伊甸园精品99久久久久久| 亚洲成人中文在线| 亚洲一级黄色录像| 91大神在线播放精品| 免费在线看一区| www.亚洲成人网| 欧美亚州韩日在线看免费版国语版| 一级免费黄色录像| 日本亚洲欧洲色α| 成人网在线播放| 亚洲一级片av| 在线一区二区日韩| 熟妇人妻一区二区三区四区 | 中文字幕黄色av| 国模精品娜娜一二三区| 亚洲男人的天堂在线观看| 手机av免费看| 国产成人高潮免费观看精品| 波多野结衣91| 蜜桃视频无码区在线观看| www国产精品com| 国产一区视频导航| 色www免费视频| 色阁综合伊人av| 韩国精品在线观看| 久久6免费视频| 久久久久久久久久久人体| 国产成人精品一区二| 黄色片免费网址| 97视频免费在线看| 国产丝袜在线精品| 欧美精品日韩在线| 成人在线中文字幕| 亚洲精品中文在线影院| 欧美成欧美va| 久久久99爱| 欧美精品久久天天躁| 国产99对白在线播放| 成人在线国产视频| 亚洲视频视频在线| 国产一区二三区| 免费看91视频| 国产成人精品视| 一区二区三区精品视频| 国产专区第一页| 正在播放一区二区三区| 亚洲变态欧美另类捆绑| 日韩高清电影一区| 久久久无码人妻精品无码| 91超碰中文字幕久久精品| 国产精品理伦片| 特一级黄色大片| 日韩人妻精品一区二区三区| 精品亚洲一区二区三区| 国产精品一区二区视频| 色天使在线视频| 91久久在线播放| 91福利精品第一导航| 99免费在线视频| 激情六月丁香婷婷| 国内精品400部情侣激情| 亚洲男帅同性gay1069| 精品黑人一区二区三区| 免费看黄在线看| 欧美日本中文字幕| 亚洲日韩欧美一区二区在线| 国产乱国产乱老熟| 亚洲一区二区三区av无码| 超薄丝袜一区二区| 亚洲少妇30p| 亚洲激情在线观看视频免费| wwwwww.欧美系列| 影音先锋国产资源| 日本不卡视频一区| 国产一区免费视频| 日韩一区二区三区视频在线| 成人免费在线播放视频| 懂色av一区二区三区四区| 欧美激情亚洲天堂| 国产精品成人在线| 久久午夜免费电影| 精品无码人妻一区二区免费蜜桃| 精品美女在线播放| 国产成人在线色| 亚洲这里只有精品| 国产日韩在线看| 久久蜜桃av一区二区天堂| 国产原创视频在线| 无码人妻精品一区二区三区66| 国产精品午夜国产小视频| 91精品国产一区二区三区蜜臀| 国产一区二区在线影院| 欧美黄色一级网站| 久久精品午夜福利| 91精品久久久久久久久| 精品成人佐山爱一区二区| 午夜精品久久久久久久久久久久久| 亚洲欧美综合精品久久成人| 日韩欧美精品在线观看| 国产精品996| 乱h高h女3p含苞待放| 免费人成自慰网站| 国产精品成人国产乱一区| 7777精品伊人久久久大香线蕉的| 处破女av一区二区| 成人小视频在线播放| 欧美性生交xxxxx| 一区视频二区视频| 国产精品日韩在线观看| 亚洲精品国产精品国自产在线| 国产精品久久久久久福利一牛影视| 精品人妻av一区二区三区| 免费观看a级片| 成人黄色片视频| 精品久久中出| 色综合91久久精品中文字幕| 欧美亚洲国产一区二区三区va| 成人av中文字幕| 国产草草影院ccyycom| 99re6热在线精品视频| 亚洲中文字幕无码专区| 国产精品国产三级国产专区53| 北条麻妃一区二区三区中文字幕| 色综合久久久久久久久久久| 国产成人免费视频网站 | 91片黄在线观看| 国产美女免费看| 伊人久久久久久久久久久久久久| 天天天干夜夜夜操| 五月天亚洲综合小说网| 国产日韩在线视频| 超碰日本道色综合久久综合| 91精品国产品国语在线不卡| 亚洲欧美在线aaa| 国产成人一级电影| 亚洲欧美日韩动漫| 中文字幕国产在线观看| 摸摸摸bbb毛毛毛片| 日本高清久久久| 免费看毛片的网址| 日韩欧美亚洲日产国产| 成人免费网视频| 91精品成人久久| 最近2019好看的中文字幕免费| 欧美三片在线视频观看 | 99视频免费观看| 欧洲日韩成人av| 欧美成人免费播放| 中文字幕日韩精品在线| 精品国产人成亚洲区| 欧美日韩在线一区二区| 亚洲一区二区三区四区中文字幕| 久久综合一区二区| 国产v综合v亚洲欧| 欧美性受xxxx狂喷水| 国产视频一区二区三区四区五区| www.欧美色| 日韩精品一区二区av| 久久久精品人妻一区二区三区四| 中文字幕精品亚洲| 娇妻被老王脔到高潮失禁视频| 激情综合丁香五月| 中国极品少妇videossexhd| 加勒比av中文字幕| 性chinese极品按摩| 熟女人妇 成熟妇女系列视频| 人妻少妇精品久久| 久久久999视频| 日本一区二区黄色| 男女男精品视频站| aaaaaa亚洲| 亚洲欧美自偷自拍另类| 亚洲xxx在线观看| 欧美视频国产视频| 成人啪啪18免费游戏链接| 日本中文字幕精品| 熟妇高潮一区二区| 91av在线免费| 国产精品久久久久久久av| 免费一级特黄3大片视频| 亚洲熟女毛茸茸| 澳门黄色一级片| 黄色一级片免费在线观看| 99超碰在线观看| 国产精品自拍第一页| 国产成人a人亚洲精品无码| 天堂一区二区在线免费观看| 久久91精品国产91久久小草| 国产精品1024久久| 国产午夜一区二区三区|