色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

大幅消滅思考過程中的“大抵或許應該”

衡宇 白小交 發自 凹非寺

量子位 | 公眾號 QbitAI

一個新框架,讓Qwen版o1成績暴漲

在博士級別的科學問答、數學、代碼能力的11項評測中,能力顯著提升,拿下10個第一!

這就是人大、清華聯手推出的最新「Agentic搜索增強推理模型框架」Search-o1的特別之處。

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

項目團隊成員發現,o1和o1類模型在推理過程中表現突出,但卻存在“知識不足”的明顯缺陷——

推理步驟太長/模型知識不足時,推理過程就很容易卡殼,導致推理鏈中的錯誤傳遞。而其中任何知識誤差都可能破壞整個推理鏈,最終對答案的正確性造成影響。

好著急,在線等,怎么辦?

Search-o1的解題思路是:暫停推理,去搜索查找缺少的知識/資料,然后再回來繼續推理。

就像咱人類思考不明白,就去查查資料,然后就想明白了似的。

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

研究者在初步實驗中發現,類o1推理模型在處理復雜問題時,平均每個推理過程中會出現超過30次的不確定詞匯,be like“或許”“可能”等。

這不僅增加了推理的復雜性,還使得手動驗證推理過程變得更加困難。因此,如何在推理過程中自動補充所需知識,成為提升大型推理模型可信度的關鍵。

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

針對于此,而Search-o1的解決辦法是這樣的:

結合RAG和用于精煉檢索文檔的Reason-in-Documents模塊增強框架,將Agentic搜索工作流整合到推理過程中,旨在通過自主知識檢索,提升大型推理模型的可靠性和適用性。

如此一來,推理模型在遇到不確定的知識點時,就能都發揮主觀能動性板去檢索外部知識,同時保持整個過程的連貫性,讓自己的推理能力更進一步。

研究團隊做了廣泛的測試后發現,在科學、數學和編碼等復雜推理任務,以及六個開放領域QA基準測試中,Search-o1的表現杠杠的。

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

目前項目已開源,抱抱臉和GitHub可自取。按慣例,本文文末有指路直通車。

(特別注明:Search-o1框架使用的基礎模型是開源的QwQ-32B-Preview)

Search-o1新框架

其實自從o1問世后,原生推理“在遇到知識缺口時易出錯”這一問題就已經被擺到臺前。

已經有很多團隊來嘗試解決上述問題,比如將策略和獎勵模型與蒙特卡洛樹搜索相結合(但這并沒有將推理內化到模型中);或者在訓練過程中將故意錯誤納入推理路徑,以部分內化這些能力;也有研究者選擇蒸餾訓練數據。

然而,這些方法受到對靜態參數化模型的依賴的限制,當內部知識不足時,這些模型無法利用外部世界的知識。

后來,又有研究團隊提出利用RAG,在推理模型中引入檢索機制,來解決生成模型中靜態參數的限制,允許訪問外部知識來解決更復雜的問題。

當出現不確定性時(例如化合物的結構),這種方法會生成有針對性的搜索查詢(例如,“反式肉桂醛的結構”);但是,檢索到的文檔通常包含冗長且不相關的信息,可能會破壞推理流程并損害連貫性。

因此,團隊提出Search-o1的核心動機,是通過自主檢索來增強具有類o1的推理模型。

Search-o1將推理模型的推理過程,和兩個核心組件集成在一起:

  • Reason-in-Documents模塊
  • Agentic RAG機制
Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

Reason-in-Documents模塊

先來說說Reason-in-Documents模塊

在Search-o1框架中,當 agentic RAG機制檢索到的外部知識文檔可能冗長且包含冗余信息,這些內容直接輸入給推理模型,可能會干擾接下來的推理。

于是團隊就提出了Reason-in-Documents,這個模塊是獨立于主推理鏈的。

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

它的作用是基于當前搜索查詢、先前推理步驟和檢索文檔,先分析文檔生成中間推理序列,再生成與當前推理步驟高度相關的精煉知識,并整合到推理鏈。

按照規定的輸出格式,若文檔提供了有用信息,則以 “Final Information [Helpful information]” 的形式輸出精煉后的知識。

若未找到有用信息,則輸出 “Final Information No helpful information found.”。

以此來確保推理過程簡潔且專注,以及推理過程的連貫性和邏輯一致性。

Agentic RAG機制

再來說說Agentic RAG機制。

Search-o1讓模型能夠在推理過程中,自主決定該在什么時候檢索外部知識。

單個問題推理時,對于每個問題,Search-o1會先初始化推理序列q。

由于推理模型M生成推理鏈R,這個過程可能會生成封裝在特殊符號 <|begin_search_query|> 和 <|end_search_query|> 中的搜索查詢。

當檢測到 <|end_search_query|> 符號后,會提取相應的搜索查詢qsearch,觸發檢索函數Search以獲取相關的外部文檔D。

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

接著把外部文檔交由Reason-in-Documents模塊處理,然后把結果整合回推理鏈。

批量推理時,Search-o1會對這批問題創建推理序列集,并行生成tokens,檢索和精煉文檔后,更新推理鏈,提高系統處理多輸入的吞吐量。

上述的所有過程都能反復進行,確保模型在整個推理過程中,都能獲得所需的外部知識支持。

實驗設置與結果

為了驗證Search-o1的有效性,研究人員進行了廣泛的實驗,評估任務包括以下兩類:

第一種是復雜推理任務。

包括PhD級別的科學問答(GPQA)、數學(MATH500、AMC2023、AIME2024)、代碼(LiveCodeBench)等。

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

Table 1數據顯示,在復雜推理任務中,所有的11個測試集上,Search-o1在其中10個任務上,都優于原生推理和傳統RAG方法。

僅有一項——LiveCodeBench之easy的成績57.7。

這個成績在Qwen2.5-Coder-32B和QwQ-32B上的表現低于原生推理,在RAG-Qwen2.5-32B、RAgent-QwQ-32B的比凹陷低于傳統RAG方法。

多提一嘴,項目論文中,研究團隊還展示了Search-o1與人類專家的比較。

研究者將Search-o1的性能和GPQA擴展集中各個領域的人類專家進行了比較人類,下面的Table 2展示的是專家在物理、化學、生物等各個學科的人類專家成績。

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

結果顯示,Search-o1在整體性能(57.9)、物理學(68.7)和生物學(69.5)方面都優于人類專家。

不過在化學子領域落后于化學家,Search-o1是40.7,人類專家是72.6。

第二種是開放域問答基準,包括:

  • 單跳QA,如自然問題(NQ)、TriviaQA等。
  • 多跳QA,如HotpotQA、2WikiMultihopQA、MuSiQue、Bamboogle等。
Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

Table 3數據顯示,Search-o1在多跳QA任務表現尤為突出,平均準確率提升了近30%,優于所有基線模型。

不過相比較而言,Search-o1在單跳任務上的成績提升不顯著。

研究人員在最后表示:

Reason-in-Documents模塊 + Agentic RAG機制,通過有效解決模型本身知識不足的問題,增強了推理模型的可信度和實用性。

在復雜問題解決場景中,Search-o1為更值得信賴和更有效的智能系統鋪平了道路

目前外網沖浪了一下,網友們表示對這個工作還是非??隙ǖ?。

尤其是對它“模擬人類認知過程”和“增強推理模型推理能力”這倆方面。

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

作者團隊

Search-o1的通訊作者是人大高瓴人工智能學院的教授竇志成

他從南開大學博士畢業后,先加入了MSRA擔任研究員,2014年9月份加入中國人民大學,并于2018年8月破格晉升教授。

Search版o1:推理過程會主動查資料,整體性能優于人類專家,清華人大出品

其余的作者包括Xiaoxi Li,Guanting Dong, Jiajie Jin,Yuyao Zhang,Yujia Zhou,Yutao Zhu, Peitian Zhang。

其中,Yujia Zhou是團隊中唯一一個來自清華的同學(其余都來自人大)。

Zhou目前在清華大學任博士后研究員,與清華大學科研院院長、計算機科學與技術系教授劉奕群合作。

這位同學在人大取得博士學位,導師正是竇志成。

arXiv:https://arxiv.org/abs/2501.05366
GitHub:https://github.com/sunnynexus/Search-o1
抱抱臉:https://huggingface.co/papers/2501.05366

參考鏈接:
[1]https://x.com/rohanpaul_ai/status/1880173989143921058
[2]https://www.cs.tsinghua.edu.cn/info/1121/3557.htm
[3]https://www.zhouyujia.cn/

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
上原亚衣av一区二区三区| 欧美精品入口蜜桃| 色综合久久悠悠| 亚洲高清久久网| 丰满人妻一区二区三区四区| 亚洲欧美久久234| 丰满人妻一区二区三区53视频| 国产xxx在线观看| 性久久久久久久久久久久久久| 九一国产精品视频| 91麻豆文化传媒在线观看| 国产精品原创巨作av| 国产成人综合亚洲网站| 亚洲一区二区三区小说| 亚洲AV午夜精品| 日韩欧美视频在线免费观看| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 国产a级全部精品| 久久国产精品电影| 久久精品国产77777蜜臀| 国产乱了高清露脸对白| 免费观看在线色综合| 国产一区在线不卡| 国产精品一区二区黑丝| 欧美风情第一页| 成人短视频在线观看免费| 激情五月五月婷婷| 五月天综合激情| 最新日韩在线视频| 欧美激情久久久久| 污视频免费在线观看网站| 国产精品乱码久久久久| 欧美亚洲一级二级| 亚洲国产一区二区三区在线播| 99久久99久久精品| 国产成人精品视| 欧美日韩三级一区| 亚洲图片欧美午夜| 国产日韩一区在线| 欧美黑人巨大精品一区二区| 欧美激情一级欧美精品| 欧美丰满老妇厨房牲生活 | www.国产一区二区| 免费观看在线色综合| 欧美重口另类videos人妖| 欧美黑人猛猛猛| 亚洲中国最大av网站| 韩国精品一区二区三区六区色诱| 91国产在线播放| 国产精品视频免费观看www| 精品亚洲一区二区三区四区五区高| 欧美男人的天堂一二区| 日韩一区国产二区欧美三区| 26uuu国产一区二区三区| 久久超碰97中文字幕| 韩国视频理论视频久久| 国内精品一区二区三区| 视频一区视频二区视频三区高| 亚洲啪av永久无码精品放毛片 | 小向美奈子av| 国产精品视频一二三| 国产精品果冻传媒潘| 欧美日韩一区二区免费在线观看| 欧美寡妇偷汉性猛交| 久久久久一区二区| 女女同性女同一区二区三区按摩| 久久人妻精品白浆国产 | 精品一区二区成人免费视频| 欧美国产日韩二区| 欧美综合一区第一页| 精品精品国产高清a毛片牛牛 | 黑人精品xxx一区| 一区二区欧美视频| 91沈先生在线观看| 国产99久久久欧美黑人| 国产高潮呻吟久久| 精品国产免费一区二区三区四区 | 中文字幕av片| 亚洲色图丝袜美腿| 欧美色视频在线观看| 九九精品免费视频| 精品一区二区三区免费| 亚洲影视在线观看| 欧美在线免费播放| 欧美黑人xxx| 国产精品23p| 久久久精品欧美丰满| 一区二区三区视频观看| av动漫在线看| 久久99欧美| 一起草av在线| 尤物九九久久国产精品的特点 | 欧美日韩一区二区三区免费看| www日韩大片| 欧美一区二视频| 亚洲美女性视频| 午夜18视频在线观看| 午夜免费福利视频| 久久久久高清| 国产馆精品极品| 欧美一级久久久久久久大片| 亚洲精品欧洲精品| 懂色av.com| 国产成人综合亚洲91猫咪| 亚洲电影免费观看高清| 91看片淫黄大片91| 欧美性生交大片| 五月天婷婷亚洲| 国产婷婷一区二区三区久久| 国产精品丝袜视频| av地址在线观看| 国产一区二区三区国产| 国产97免费视| 77777亚洲午夜久久多人| 欧美成人精品高清在线播放| www.五月天色| 亚洲一区二区福利| 日批视频在线播放| 国产亚洲欧美在线视频| 亚洲少妇中出一区| 欧美一级午夜免费电影| 国模精品视频一区二区| 国产精品成人aaaaa网站| 久久久国产精品久久久| 中文字幕在线观看不卡| 欧美性大战xxxxx久久久| 国产男人精品视频| 一级片免费在线播放| www.黄色av| 国产精品999久久久| 亚洲一区欧美一区| 日韩欧美久久久| xxx国产在线观看| 国产欧美一区在线| 成年人网站av| 久久久极品av| 26uuu成人网一区二区三区| 国产日韩av一区二区| 日韩av不卡在线播放| 五月综合色婷婷| 亚洲成人自拍网| 一区二区传媒有限公司| 久久久久久久久一| www.超碰com| 亚洲第一天堂网| 亚洲第一男人天堂| 老司机午夜精品| 国产成人看片| 久久久久成人精品无码| 欧美一级片在线观看| 波多野结衣家庭教师| 欧美在线视频精品| 2014亚洲精品| 成人激情综合网站| 亚洲精品视频导航| 亚洲青青青在线视频| 国产欧美视频在线观看| 亚洲aa在线观看| 亚洲欧洲国产精品久久| 国产一二三精品| 久久精品国产精品国产精品污 | 男人日女人视频网站| 欧美一区二区三区免费大片| 国产青青草视频| 浅井舞香一区二区| 97在线视频人妻无码| 亚洲欧美www| 少妇搡bbbb搡bbb搡打电话| 国产夫妻自拍av| 欧美第一淫aaasss性| 欧美丰满艳妇bbwbbw| 精品国产精品网麻豆系列| 久草免费资源站| 色av成人天堂桃色av| 网站一区二区三区| 我和岳m愉情xxxⅹ视频| 日本黄色一区二区三区| 成人毛片老司机大片| 日本久久中文字幕| 天天射天天干天天| 欧美激情欧美激情| 中文字幕人妻互换av久久| 久久精品电影网站| 精品无码人妻一区二区三| 中文字幕国产亚洲| 国产成人精品片| 久久999免费视频| 波多野结衣黄色网址| 久久人人爽人人爽人人片av高清| 国产免费一级视频| 91高清免费视频| 精品久久人妻av中文字幕| 亚洲欧美另类动漫| 国产精品五月天| av在线免费观看国产| 久久久久久综合| 妺妺窝人体色www看人体| 九一在线免费观看| 日韩免费视频一区| 欧美性x x x| 久久综合88中文色鬼| 最近中文字幕在线观看视频| 欧洲成人在线视频| 日韩精品一区第一页| 国产区一区二区三区| 成人白浆超碰人人人人| 免费网站在线观看视频| 午夜精品久久久久久久久| 久久久精品国产网站| 欧美视频在线观看网站| 影音先锋成人资源网站| 日韩视频第一页| 一本大道伊人av久久综合| 国产精品xxx在线观看www| 亚洲人成人一区二区在线观看 | 欧美三级电影网站| 日本一本在线视频| 国产日韩中文字幕| 欧美久久一二三四区| 欧美日韩在线免费播放| 日韩欧美在线视频观看| 亚洲一区二区观看| 国产亚洲激情视频在线| 亚洲天堂中文字幕在线| 99精品欧美一区二区三区| 成人av免费观看| av五月天在线| 欧美videos大乳护士334| 精品91久久久| 国产日韩欧美91| 国产成人综合自拍| 黄在线观看网站| 7777精品伊人久久久大香线蕉超级流畅| 欧美波霸videosex极品| 久久久久久中文| 婷婷精品国产一区二区三区日韩 | 国产又粗又猛又爽又黄av| x99av成人免费| 天堂网av在线播放| 欧美日韩中文字幕在线播放| 色综合激情五月| 国产在线综合网| 成人在线视频福利| 国产欧美日韩视频在线观看| 国产麻豆剧传媒精品国产av| 少妇精69xxtheporn| 久久狠狠婷婷| 97超碰青青草| 成人免费视频国产免费| 久久久成人精品视频| www男人的天堂| 日韩精品另类天天更新| 欧美亚洲一区二区在线观看| 久久精品视频1| 欧美国产1区2区| 色黄视频免费看| 亚洲高潮无码久久| 91麻豆精品国产91久久久使用方法| 亚洲成人黄色av| 午夜精品www| 国产日韩一级二级三级| 色综久久综合桃花网| 日本中文字幕二区| 国产精品久久久久久久久免费看| 岛国av午夜精品| 国产精品www爽爽爽| 国产成人av在线播放| 国产视频一区二区三区在线观看| 国产一级免费片| 欧美在线播放视频| 国产精品久久午夜夜伦鲁鲁| 亚洲AV成人无码精电影在线| 91久久国产自产拍夜夜嗨| 精品久久久久久久中文字幕| 国产精品一区二区6| 日韩av一级大片| 日韩精品一区二区三区视频在线观看| 国产又粗又黄又爽| 男人操女人免费软件| 久久精品亚洲热| 9l国产精品久久久久麻豆| 日韩一区二区a片免费观看| 91免费视频国产| 色诱亚洲精品久久久久久| 探花国产精品一区二区| 国产欧美综合一区| 在线视频日本亚洲性| 波波电影院一区二区三区| 女教师淫辱の教室蜜臀av软件| 国产v亚洲v天堂无码| 欧美三级电影在线看| 五月婷中文字幕| 不许穿内裤随时挨c调教h苏绵 | 日韩精品不卡| 日韩精品一区二区三区视频在线观看| 久久性色av| 中国黄色a级片| 成人av免费看| 欧美久久高跟鞋激| 久久精品噜噜噜成人av农村| 无码人妻aⅴ一区二区三区| 91欧美激情另类亚洲| 在线中文字幕一区| 日韩国产精品91| 日韩丰满少妇无码内射| 日韩经典在线视频| www国产精品视频| 国产亚洲视频系列| 最新在线中文字幕| 污污网站免费观看| 1卡2卡3卡精品视频| 日韩美一区二区三区| 99久久精品久久久久久清纯| 玖玖爱免费视频| 亚欧无线一线二线三线区别| 77777少妇光屁股久久一区| 都市激情亚洲色图| 麻豆一区二区三| 少妇aaaaa| 亚洲精品无码国产| 国产+人+亚洲| 欧美性受xxxx黑人xyx性爽| 韩国三级在线一区| 国产成人精品av久久| 亚洲一区二区四区蜜桃| 91理论片午午论夜理片久久| 欧美手机在线观看| 一区二区三区.www| 欧美系列一区| 日本高清视频网站| 久久久久久影视| 欧美网站大全在线观看| 亚洲视频在线视频| 国产精品一区二区三区精品 | 中文字幕高清在线免费播放| 污色网站在线观看| 国产伦精品一区二区三区四区视频| 日韩精品视频免费| 亚洲高清在线精品| 国产成人高清视频| 91丨porny丨在线中文| 中文字幕在线观看的网站| 蜜桃视频一区二区在线观看| 国产日韩换脸av一区在线观看| 亚洲男人7777| 欧美日韩黄色大片| 91蜜桃在线免费视频| 天天操天天爱天天干| 久久久99精品| 91亚洲一区二区| 伊人再见免费在线观看高清版 | 午夜久久久影院| 东方aⅴ免费观看久久av| 亚洲性生活大片| 国产探花在线视频| 性生交大片免费看l| 中文字幕一区二区三区在线乱码 | 天天色综合天天色| 在线观看成人av| 国产精品v欧美精品v日韩| 5278欧美一区二区三区| 亚洲视频综合网| 欧美性大战久久久| 亚洲最大色网站| 久久蜜桃av一区精品变态类天堂| 久久国产日本精品| 在线观看免费中文字幕| 免费视频一二三区| 亚洲欧美va天堂人熟伦| 能看毛片的网站| 久久国产色av免费观看| 中文字幕中文字幕99| 国产欧美亚洲日本| 成人中文字幕在线观看| 欧美亚洲日本网站| 欧美插天视频在线播放| 国产午夜精品全部视频在线播放| 日韩一区二区视频| 欧美三级中文字幕在线观看| 一区二区三区国产豹纹内裤在线| 91美女蜜桃在线| 成人黄色一级视频| 国产成人亚洲精品狼色在线| 无码国精品一区二区免费蜜桃| 国产ts变态重口人妖hd| 一区二区视频播放| 一级黄色av片| 日韩女同强女同hd| 精品午夜福利视频| 91视频免费在线看| 国产又黄又粗视频| 中文字幕在线观看免费高清| 亚洲观看黄色网| 久久久久亚洲无码| 国产精品久久久久野外| 国产亚洲色婷婷久久| 成人高清在线观看视频| 男插女视频网站| caopor在线| 狠狠人妻久久久久久综合蜜桃| 37p粉嫩大胆色噜噜噜| 尤物视频最新网址| 法国伦理少妇愉情| 国内毛片毛片毛片毛片毛片| 色欲AV无码精品一区二区久久| 欧美精品欧美极品欧美激情| 国产精品久久AV无码| 无套内谢大学处破女www小说| 成人免费无遮挡无码黄漫视频| 老司机精品免费视频|