色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

6小時復刻AI IMO金牌成果,螞蟻多智能體新進展已開源

多模群體智能戰勝單模

AWorld項目團隊投稿 發自 凹非寺
量子位 | 公眾號 QbitAI

2025年的IMO,好戲不斷。

7月19日,全世界頂尖大模型在2025年的IMO賽場上幾乎全軍覆沒。時隔1天,OpenAI、DeepMind等頂尖實驗室就在IMO 2025賽場斬獲5/6題,震驚數學圈。

有意思的是,7月23日——兩位來自Harvard和UCLA的學生,用Gemini 2.5 Pro+自研多輪驗證框架,在arXiv扔下一篇論文,首次系統性拆解了「解題+驗證」的IMO解題方法論。48小時后,他們開源了完整代碼。

來自螞蟻的多智能體框架AWorld項目團隊也加入了這場卷王之爭:

7月24日啟動,僅僅6小時,采用AWorld智能體框架,復現并開源了DeepMind的5/6道解題結果,并直接給出了可一鍵運行的多智能體IMO系統。

圖片

果然,大家好奇的點還是跟傳統長思維鏈LangChain等框架有什么不一樣。作者給出的回復,核心就是一個詞,自我進化。即,多智能體能夠超越單個智能體,能夠用于復雜問題協同,以及強化學習的獎勵模型等,最終實現AGI。

圖片

IMO 2025,把復雜推理模型推向了一種新的高度(盡管還處在實驗室階段,但DeepMind透露會對外)。

不過,能解IMO級別數學題的超級單智能體實屬稀有。AWorld的實驗也首次用工程系統證明:多智能體協同的智力上限,有可能超越其依賴的單個模型。

單模的「不可能三角」:為什么必須上多智能體?

單個裸模型,包括Gemini 2.5 pro,幾乎無法一次推理答對IMO賽題:level 1的第1,第4題在小概率下一次推理能答對(背景:IMO包括六道競賽題目,分為兩天進行,參賽者每天需完成3道題目,因此第一題難度相對較低),但是其余4題,一定需要多智能體協同才能完成,這揭露了一個殘酷現實:IMO級問題=單模的不可達之地。

AWorld的實測數據更扎心:

  • 單模嘗試第3題:連續10次推理全部失敗。
  • 多智能體協同:通過「解題者+驗證者」雙角色對話,第3題在第5輪迭代就生成了完整的解答。
  • “多智能體協同的智力上限,有可能超越其依賴的單個模型”的本質是什么呢?

為此,AWorld團隊嘗試提出了幾種解釋視角:

構建最優輸入:從“好問題”到“完美上下文”

多智能體協同的核心優勢在于它能動態地構造出一個遠超初始提問的、高質量的輸入信息。

基本原理(y = f(x)):我們可以將大模型視為一個固定的函數f,其輸出y的質量完全取決于輸入x的質量。

初始輸入的局限:對于如IMO競賽題這類復雜任務,最初的提問(x_0)信息稀疏,缺乏足夠的引導“腳手架”。這使得模型難以在其龐大的能力空間中,僅憑一次嘗試就找到通往正確答案的路徑。

協同的價值:多智能體系統并非提升模型f本身,而是設計了一個“智能流程”:通過生成和整合中間思想(如解題草稿、批判性反饋、改進建議),共同構建出一個信息極其豐富的“超級上下文”。這最終解鎖了模型早已具備、但通過簡單提問難以觸達的深層能力。

實現“元認知”:為系統外掛一個“反思模塊”

元認知,即“關于思考的思考”,是高級智能的核心標志。它包括自我監控、自我評估和自我修正的能力。單個LLM本身不具備真正的元認知,但可以通過角色定義(Role-Play)來執行元認知功能。

它不解決問題,而是評估解決方案的合理性、尋找邏輯漏洞、提出改進建議,從而避免了單模型容易陷入的思維定式和錯誤。

通過交互降低“信息熵”(Reducing Information Entropy)

一個復雜的IMO問題,其解空間的不確定性(信息熵)非常高。每一次有效的多智能體交互都在為系統提供新的約束,從而降低這種不確定性。

例如,審閱者指出“你的第一步假設A是無證據的”,這個反饋極大地減少了后續需要探索的可能性,使計算資源能更集中地探索更有希望的路徑,從而顯著提升了求解的效率和準確性。

綜上,多智能體協同的優越性源于其智能化的流程,而非個體能力的提升。該流程通過協作分解與迭代修正,能有效解鎖基礎模型的深層潛力,最終涌現出超越個體能力之和的系統級智能。

AWorld的「六小時魔法」:把論文變成可運行系統

面對地獄級難度的IMO,相比模型頂流拿下成績秀肌肉,能夠復現的解題過程可能更加有利于技術的演進,所以我們更希望看到有一些開源的工作。AWorld的復現方式,提供了一些思路:

  • 核心結構:采用了”做題家”和”驗證者”的雙智能體對話機制,兩者均依賴于相同的基礎模型(如Gemini 2.5 pro)來構建。其中,做題家負責生成數學解答,驗證者扮演IMO考官角色進行嚴格驗證,兩者通過多輪對話迭代優化解答質量。
  • 核心要素:設計了完整的對話循環機制,包括自動檢測終止條件、最終答案、記錄完整對話歷史,以及基于驗證者反饋的解答重構策略,有效挖掘了基礎模型的潛在能力。
  • 身份設定與上下文工程:做題家采用嚴格的數學證明格式要求,驗證者則具備詳細的錯誤分類體系和標準化的驗證流程,這種專業化的角色分工顯著提升了問題解決的質量和準確性。

目前,AWorld在著名的GAIA Test榜單(即通過增加工具支持、更高效的提示、接入搜索等手段獲得增強能力的新一代大語言模型的基準)上達到了77.08分,在所有署名的智能體中排名第三,在所有開源工作中排名第一。

為多智能體協同而生

作為一個為構建生產級、可擴展多智能體系統而設計的下一代框架,AWorld核心優勢是采用事件驅動的群體智能架構,徹底超越了傳統LangChain等框架的局限。

智能體之間通過事件總線進行異步通信與協作,而非簡單的順序調用。這使得復雜的實時交互成為可能。

強大的工具與模型生態

  • 模型即插即用:通過統一接口,可在30秒內輕松切換OpenAI、Gemini、Claude等任意大語言模型,方便對比測試與成本優化。
  • MCP協議支持:將MCP作為核心能力,允許智能體將其他模型或智能體作為工具調用,極大拓展了能力邊界。所有工具均在安全沙箱中執行,保障企業級安全。

生產級的穩健性與可觀測性

  • 全鏈路可觀測性:提供覆蓋智能體決策、工具調用全過程的追蹤、指標與日志,讓復雜的系統行為清晰透明,易于調試。
  • 精密的上下文與內存管理:支持長短期記憶和復雜編排,確保智能體在執行長周期任務時能保持狀態、不“失憶”。

支持模型持續進化的學習閉環

  • 開放訓練接口:AWorld不僅是執行框架,更是進化平臺。它提供開放接口,可與主流訓練框架結合,利用智能體在真實任務中產生的交互數據對底層模型進行訓練。
  • 實現智能體自我進化:通過“數據-訓練-部署”的閉環,讓智能體在特定領域變得越來越“聰明”,構建真正的專家智能體系統。

如何體驗「IMO級多智能體」?

3步運行(詳見README.md):

  • 一鍵準備環境

進入項目目錄AWorld/examples/imo,然后直接運行腳本./setup_env.sh。自動創建獨立的Conda環境并安裝所有必需的依賴。

  • 配置API密鑰

復制模板文件cp.env_template.env,然后編輯新生成的.env文件,填入你自己的大模型API密鑰(LLM_API_KEY)、模型名稱(LLM_MODEL_NAME)和接口地址(LLM_BASE_URL)。

  • 激活環境并運行

首先激活環境,然后執行主程序來解決指定的數學問題,例如運行python run.py —q imo4來解決IMO2025第4題。

寫在最后:IMO只是開始

AWorld的復現實驗,拋出了一個激進結論:當前多智能體系統的數學能力,已超越99%人類選手(雖然測試集有限)。

當單模在IMO折戟時,多智能體系統已經證明:AI的智能上限,可能不只在于模型有多大,更在于我們如何組織它們工作。

多智能體協作,可能是一條通往更高群體智能的有效路徑。更震撼的是未來潛力:這套系統正在作為reward model訓練下一代模型——用多智能體生成的「高階推理軌跡」作為訓練數據,相當于讓模型從IMO金牌選手的草稿紙里學習。

下一站,AWorld團隊透露正在測試「多智能體+形式化驗證」組合,目標直指Lean4形式化證明。

IMO 2026,可能將是人類最后一次有機會戰勝AI的數學競賽。

Gemini 2.5 Pro+:
論文地址:https://arxiv.org/pdf/2507.15855

AWorld:
GitHub:https://github.com/inclusionAI/AWorld

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

—??—

圖片

?? 點亮星標 ??

科技前沿進展每日見
版權所有,未經授權不得以任何形式轉載及使用,違者必究。
欧美在线观看黄| 国产精品专区第二| 国产精品自产拍在线观看中文| 日韩视频在线播放| 免费无码一区二区三区| 国产精品欧美综合亚洲| 一区二区三区成人| 美女av一区二区| 日本视频一区在线观看| 刘亦菲国产毛片bd| 黑人精品欧美一区二区蜜桃| 在线观看成人小视频| 97精品一区二区视频在线观看| 中文字幕av日韩精品| 白丝女仆被免费网站| 久久精品国产一区二区三区免费看 | 亚洲综合av影视| 国产chinesehd精品露脸| 久久狠狠婷婷| 日韩一级成人av| 麻豆精品传媒视频| 中文字幕91视频| 国产成人在线视频免费播放| 亚洲第一黄色网| 欧美国产一二三区| 秋霞欧美一区二区三区视频免费| 国产一区二区免费视频| 亚洲韩国欧洲国产日产av| 热re99久久精品国99热蜜月| 日本黄色录像视频| 99这里只有精品| 丝袜美腿精品国产二区| 狠狠干视频网站| 不卡的av电影| 欧洲亚洲国产日韩| 国产精品一区二区在线观看| 一级肉体全黄裸片| 成人99免费视频| 色哟哟网站入口亚洲精品| 激情六月天婷婷| 精品国产九九九| 一本一本大道香蕉久在线精品| 91日本在线观看| 四虎永久免费地址| 亚洲视频一区二区免费在线观看| 欧美美女15p| 中文字幕国产传媒| 免费激情视频网站| 欧美成人性福生活免费看| 糖心vlog在线免费观看| 国产乱子伦精品无码码专区| 欧美一级日韩一级| 天堂va久久久噜噜噜久久va| 国产精品变态另类虐交| 亚洲第一狼人社区| 国产精品一区视频| 农村妇女精品一区二区| 亚洲18女电影在线观看| 欧美一区二区在线| 制服.丝袜.亚洲.中文.综合懂色| 91高清在线观看| 日韩电影在线播放| 中文字幕视频在线播放| 欧美一区二区三区视频免费播放 | 天天操天天色综合| 欧美三级网色| 一级做a爱片久久毛片| 亚洲丁香婷深爱综合| 91av在线免费播放| 国产经典欧美精品| 日韩免费观看视频| 538精品在线视频| 91成人免费在线视频| 国产在线无码精品| 亚洲爱情岛论坛永久| 色悠悠久久久久| 不用播放器的免费av| 丁香天五香天堂综合| 国产日韩av在线播放| 中文字幕日韩av电影| 国产wwwxx| 99麻豆久久久国产精品免费优播| 成人免费xxxxx在线观看| 日本中文字幕久久| 精品亚洲一区二区三区在线观看| 亚洲第一中文av| 国产精品情趣视频| 久久99国产精品99久久| 精品乱码一区内射人妻无码| 欧美一区二区在线播放| 男人透女人免费视频| 99精品在线免费| 国外成人免费视频| www.久久综合| 国产一区二区三区在线视频| 强迫凌虐淫辱の牝奴在线观看| 亚洲精品国产无套在线观| 超碰97在线看| 成人aa视频在线观看| 成人性生交大片免费看视频直播| 亚洲熟妇av乱码在线观看| 色偷偷9999www| www.99re7| 亚洲第一中文字幕| 五月婷婷综合色| 亚洲性猛交富婆| 精品一区二区电影| 性高潮久久久久久| 欧美激情在线一区二区三区| 日本在线播放不卡| 另类小说视频一区二区| 国产精品永久免费| 国产男女猛烈无遮挡| 欧美又大粗又爽又黄大片视频| 久久久久亚洲av无码专区 | wwwwww.欧美系列| 欧美激情第六页| 成人性视频网站| 欧美精品中文字幕一区二区| 九色综合国产一区二区三区| 精品国产二区在线| 国产伦理精品不卡| 久久精品国产理论片免费| 亚洲天堂777| 69久久夜色精品国产69乱青草| 波多野结衣午夜| 久久青草福利网站| 国产成人av免费| 91精品国产91久久久久久吃药 | 国产精品视频线看| 粉嫩av一区二区三区天美传媒 | 国产精品无码在线播放| 国产精品视频中文字幕91| 精品国产乱码一区二区三| 国产精品欧美激情在线播放| 人妻丰满熟妇av无码区hd| 51国产成人精品午夜福中文下载 | 国产女人18毛片水真多成人如厕 | 国内外成人激情视频| 亚洲欧美色一区| 久久精品视频在线观看免费| 欧美午夜精品一区二区蜜桃| 久久国产精品无码一级毛片| 日韩欧美中文一区| 澳门黄色一级片| 欧美伦理91i| 性一交一乱一色一视频麻豆| 成人18视频| 国产女同性恋一区二区| 成人av毛片在线观看| 欧美一级搡bbbb搡bbbb| 你懂得视频在线观看| 亚洲第一区在线观看| 久久高清无码视频| 欧美精品免费在线| www.xxx国产| 免费看成人片| 亚洲激情五月婷婷| 国产又黄又嫩又滑又白| 日韩三级av在线播放| 精品无码人妻一区二区三| 91高清视频免费观看| 精品亚洲aⅴ乱码一区二区三区| 18视频在线观看娇喘| 亚洲一区二区影院| 国产人妻精品午夜福利免费| 欧美一区二区在线免费播放 | 日韩中文在线不卡| 姝姝窝人体www聚色窝| 亚洲精品一区二区三区av| 曰韩精品一区二区| 国产精品夜夜夜爽阿娇| 51视频国产精品一区二区| 国产一区二区久久| 色一情一乱一伦一区二区三区日本| 欧美一区午夜视频在线观看| 丰满人妻老熟妇伦人精品| 国产精品羞羞答答| 成人一区二区三区视频| 爱福利视频一区二区| 在线免费亚洲电影| 日本免费在线播放| 国产亚洲福利社区| 午夜精品免费在线| 久久精品视频8| 国产精品久久亚洲| 亚洲国产成人av| 欧美日韩国产精品一区二区三区| 91香蕉国产在线观看| 亚洲国产精品av| 免费视频91蜜桃| 欧美一区二区三区免费观看| 91免费精品国自产拍在线不卡| 亚洲国产午夜精品| 久久色精品视频| 精品无人区卡一卡二卡三乱码免费卡 | 日本少妇高潮喷水xxxxxxx| 欧美一区二区三区免费视| 精品一区免费av| 岛国av在线免费| 精品久久久av| 国产美女精品在线| 91porn在线| 岛国视频一区| 欧美日韩免费视频| 午夜精品久久久久久久99热影院| 精品国产91久久久久久久妲己| 国产福利免费视频| 亚洲综合欧美激情| 欧洲美女免费图片一区| 亚洲一区在线播放| 99精品人妻国产毛片| 玖玖精品在线视频| 在线视频中文亚洲| 亚洲日本中文字幕区| 无码人妻aⅴ一区二区三区有奶水| 99精品视频播放| 国产精品av在线播放| 欧美色大人视频| 久久福利资源站| 91ts人妖另类精品系列| 日本免费在线视频观看| 欧美成年人在线观看| 又紧又大又爽精品一区二区| 国产极品久久久| 日韩av电影网址| 国产欧美日韩小视频| 97在线视频免费观看| 疯狂做受xxxx高潮欧美日本| 三级影片在线观看欧美日韩一区二区 | 日韩一区在线免费观看| 国产日韩在线观看一区| av av在线| 亚洲欧美在线网| 欧美大胆a视频| 午夜精品一区二区三区三上悠亚| 久久一区二区三区超碰国产精品| 国精产品一区一区三区免费视频| 日韩精品最新在线观看| 欧美大胆a视频| 色88888久久久久久影院野外| 日本麻豆一区二区三区视频| 日韩三级在线观看视频| 国产免费999| 国产尤物99| 最近中文字幕mv在线一区二区三区四区| 久久亚洲捆绑美女| 亚洲欧美一二三区| 久久久久成人精品无码中文字幕| 中文字幕在线乱| 国产精品99蜜臀久久不卡二区| 日韩精品一区国产麻豆| 国产精品国产自产拍高清av王其| 精品国产99久久久久久宅男i | 国内毛片毛片毛片毛片毛片| 毛葺葺老太做受视频| 精品视频免费观看| 69久久夜色精品国产69| 国产亚洲美女久久| 色老头久久综合| www.激情成人| 日本免费网站在线观看| 久久精品国产亚洲av麻豆色欲 | 亚洲一区二区三区四区av| 性欧美精品一区二区三区在线播放 | 91免费版看片| 99国产视频在线| 91国内在线视频| 国产午夜一区二区| 欧美日韩精品一区二区三区 | 午夜精品一区二区在线观看的| 97超视频免费观看| 精品偷拍一区二区三区在线看| 精品国产成人在线| 91美女视频网站| 久久精品国产精品亚洲精品 | 亚洲一区二区在线观| 91免费版网站入口| 国内精品久久久久久久| 亚洲人成在线一二| 在线播放一区二区三区| 亚洲国产综合在线| 国产日韩精品一区| 精品一区二区三区久久| 亚洲国产视频一区二区三区| av资源免费观看| 国产精品视频看看| 国产麻豆天美果冻无码视频 | 人妻精品久久久久中文| 精品人妻伦一二三区久| 欧美精品色视频| 色片在线免费观看| 欧美v在线观看| 九一国产精品视频| 日韩三级电影免费观看| 国产综合久久久久久| 久久久久久久久久国产精品| 亚洲三级av在线| 欧美日韩高清一区二区不卡| 亚洲一二三专区| 国产激情91久久精品导航 | 亚洲综合一区中| 国产女同在线观看| 亚洲不卡的av| 亚洲国产果冻传媒av在线观看 | 亚洲精品综合在线观看| 综合色婷婷一区二区亚洲欧美国产| 好吊色欧美一区二区三区视频| 91精品视频在线播放| 91禁国产网站| 欧美极品少妇xxxxⅹ裸体艺术| 亚洲成成品网站| 欧美日韩美女一区二区| 亚洲少妇30p| 亚洲免费资源在线播放| 国产精品久久久久久妇女6080| 成人毛片在线观看| 国产成人自拍网| 国产精品亚洲午夜一区二区三区| 毛片av一区二区| 农村少妇久久久久久久| 超碰在线播放97| 99国产精品99| 午夜国产福利视频| 成人高清dvd| 亚洲视频小说| 天堂资源在线亚洲资源| 精品综合久久| 国产美女在线精品免费观看| 亚洲综合日韩在线| 91在线观看欧美日韩| 国产黑人绿帽在线第一区| 国产精品h在线观看| 国产精品亚洲аv天堂网| 国产精品免费aⅴ片在线观看| 久久久精品人体av艺术| 成人精品视频.| 久久久久久久综合色一本| 久久中文娱乐网| 日韩一区在线看| 亚洲国产成人tv| 91成人国产精品| 日韩一区二区在线看| 亚洲激情视频网站| 精品动漫一区二区三区在线观看| 精品视频一区在线视频| 国产一区二区三区在线播放免费观看| 在线观看亚洲区| 97精品一区二区三区| 国产精品视频网址| 国产精品有限公司| 韩国成人一区| 99亚洲国产精品| www.国产在线视频| 欧美成人福利在线观看| 国产chinese中国hdxxxx| 丰满人妻一区二区三区53视频| 亚洲国产果冻传媒av在线观看| 中文字幕一区二区久久人妻网站| 长河落日免费高清观看| 久久久久久久黄色片| 在线视频 中文字幕| 日日夜夜一区二区| 国产在线不卡一区| 久久综合99re88久久爱| 午夜视频在线观看一区| 日韩欧美专区在线| 久久精品国亚洲| 欧美在线视频观看| 精品一区日韩成人| 日韩av三级在线| 鲁大师私人影院在线观看| 影音先锋男人资源在线观看| 好吊色在线视频| 免费高清不卡av| 99精品视频在线免费观看| 精品久久久精品| 亚洲人成五月天| 亚州av一区二区| 欧美日韩天天操| 日韩欧美在线免费观看视频| 色欲狠狠躁天天躁无码中文字幕 | 成人免费a级片| 亚洲国产综合视频| 毛片毛片女人毛片毛片| 精品无码三级在线观看视频| 一级日本不卡的影视| 亚洲风情亚aⅴ在线发布| 国产精品久久久久久婷婷天堂| 欧美二级三级| 九九热视频免费| 亚洲另类在线观看| 国产精品正在播放| 色综合天天综合网天天看片| 日韩在线视频一区| 国产一区二区三区免费不卡| 黄网站欧美内射| 小泽玛利亚一区| 亚洲av无码国产精品久久不卡 | 久久久久久久麻豆| 亚洲欧美黄色片| 久久久精品tv| 亚洲国产成人在线视频| 成人黄色av播放免费| 美女福利视频在线| 久久久久成人片免费观看蜜芽| 日本激情一区二区三区| 亚洲成精国产精品女| 这里只有精品在线观看| 日本精品一区二区三区视频 |