色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

微軟:兩個AI相互糾錯,數(shù)學再漲5分

合作才能供應!LLM互相糾錯可提高數(shù)學水平

奇月 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

提升LLM數(shù)學能力的新方法來了——

一個大模型不行,那就兩個。讓他們彼此合作,糾正對方的錯誤。

這就是來自加州大學和微軟研究院的最新研究成果:Flow-DPO。通過使用在線學習流(Flow)和直接偏好優(yōu)化(DPO, Direct Preference Optimization),可以讓LLM生成更加詳細和精確的推理軌跡。

同時,這種在線多智能體(Agent)的學習形式還能挖掘數(shù)據(jù)中的深層信息,有效避免了人類標注數(shù)據(jù)不夠準確的問題。

Image

我們先一起看個例子感受一下。

比如針對下面這道題:

方程 x + 2y + 3 = 0 的圖與方程 ax + 2y + 3 = 0 的圖互相垂直。請問ax + 2y + 3 = 0中,a 的值是多少?

基準回答是這樣的:

方程 x + 2y + 3 = 0 的圖形的斜率為 -1/2,因為圖形垂直,所以 ax + 2y + 3 = 0 的圖形的斜率必須是 x + 2y + 3 = 0 的負倒數(shù)。因此,方程 ax + 2y + 3 = 0 的斜率為2,改寫為2y = -ax – 3,然后兩邊除以 2,得到 y = -a/2x-3/2。將此與斜率截距形式 y = mx + b 相比,我們發(fā)現(xiàn)斜率 m 為 -a/2。由于我們知道斜率為 2,所以 – a/2= 2。將兩邊乘以 -2,得到 a = -4,答案為:-4。

Flow-DPO的回答是這樣的:

要解決這個問題,我們需要了解線性方程中垂直線的概念。當兩條直線垂直時,它們的斜率互為負倒數(shù)。讓我們以斜率-截距形式復述給定方程 x + 2y + 3 = O,即 y = -1/2x – 3/2。這告訴我們直線的斜率是 – 1/2。現(xiàn)在,我們需要找出方程 ax + 2y + 3 = 0 所表示的直線的斜率。我們可以將方程改寫成斜率-截距形式,即 y = -a/2x – 3/2。這告訴我們這條直線的斜率是-a/2。由于兩條直線垂直,因此它們的斜率互為負倒數(shù)。這意味著 -1/2 * (-a/2) = 1,簡化為 a = -4。因此,a 的值為 -4。

GTP-4o當裁判,針對兩個模型的回答分析了一下,它認為答案B(FLow-DPO)更好,原因有兩點:

1.概念解釋

答案 A 的回答是:“我們可以利用斜率之間的負倒數(shù)關系來求解 a”。答案 B 花時間明確解釋了垂直的概念,強調(diào)垂直線的斜率是負倒數(shù)。這種回答更有教育意義,可以讓讀者理解數(shù)學背后的推理。

2.解題思路清晰

答案A推導出了正確的方程并正確地求解了方程,但引入了一些不必要的步驟。

例如,中間步驟涉及將方程改寫為2y = -ax – 3 和兩邊除以 2 的中間步驟比必要的步驟復雜。

答案 B 立即使用兩個方程的斜截距形式簡化了方法。它有效地解釋了如何提取斜率,并直接比較了兩個等式的斜率,過程更直接,更容易理解。

結(jié)論

答案 B 的解釋更清晰、更透徹,既注重概念和公式,又避免了不必要的復雜性,這種循序漸進的方法更易于理解和掌握。

Image

可以看到,在解決真實數(shù)學問題的時候,F(xiàn)low-DPO生成的推理過程不僅有更詳細的指導,還避免了不必要的復雜性,增強了可讀性和理解性。

這是怎么做到的呢?

兩個大模型彼此合作

針對LLM解決數(shù)學問題時反饋信息有限標注數(shù)據(jù)質(zhì)量不高等問題,團隊提出了一種新的方法。

那就是通過在線學習流(Flow)和直接偏好優(yōu)化(DPO)學習來生成高質(zhì)量的推理軌跡。

具體分為2個部分:

1.增量輸出生成Flow(Incremental Output Production Flow)

Flow-DPO采用了增量輸出生成Flow,其中有兩個獨立的LLM(Answer LLM和Stop LLM)協(xié)同工作,通過迭代通信構建解決方案。

具體來說,Answer LLM一次會生成一個有限的答案塊,而Stop LLM則判斷部分答案是否達到最終狀態(tài),兩個LLM通過迭代式學習不斷進步。

Answer LLM和Stop LLM的底層都是相同的基礎模型,但它們使用不同的LoRA適配器進行了微調(diào),可以專門完成各自的任務。

而且在訓練過程中,F(xiàn)low-DPO可實現(xiàn)更精細的控制較小的塊大小,靈活適應不同的概念和方法,較大的塊大小近似于單次模型生成。

Image

2.在線Flow學習與回滾(Online Flow Learning with Rollouts)

Flow-DPO還會通過在線DPO學習和回滾來增強Flow。

對于每個輸入問題,Answer LLM會生成一個答案片段,一直持續(xù)到產(chǎn)生完整的回答。

然后模型會在每個輸出節(jié)點進行隨機展開,比如在生成初始答案片段且Stop LLM判斷為“否”后,F(xiàn)low還會生成另一個答案片段,基于之前的部分答案繼續(xù)構建。

如果兩個答案在正確性上不同,就把它們作為答案語言模型的DPO對,引導到正確答案的那個片段被選為首選響應。

Image

顯著提高LLM數(shù)學推理能力顯著提高

為了驗證Flow-DPO的性能,研究團隊還設計了精密的驗證實驗,具體設置如下

  • 數(shù)據(jù)集:實驗使用了MetaMath數(shù)據(jù)集,該數(shù)據(jù)集基于于GSM8K和MATH數(shù)據(jù)集,并通過數(shù)據(jù)增強技術進行了增強。
  • 模型選擇:實驗采用了兩種不同規(guī)模的模型:Llama-3-8B-Instruct和Phi-3-medium-128k-instruct (14B)
  • Flow學習階段:在Flow學習階段,團隊使用不同的LoRA適配器對Answer LLM和Stop LLM進行微調(diào),讓它們在DPO訓練中的能力更加專業(yè)。
  • 編譯階段:在編譯階段,收集Flow生成的正確推理軌跡和基線模型生成的正確推理軌跡,進行獨立評估。

最終結(jié)果顯示,使用了Flow-DPO之后,Llama3模型和Phi3在數(shù)學推理上的能力都大幅提升了!

一起來看看具體結(jié)果分析:

1.漸進驗證準確率(Progressive Validation Accuracy)

漸進驗證準確率的準確定義,是模型在訓練前對輸入訓練數(shù)據(jù)的累積準確度,公式和變量含義如下圖所示:

Image

實驗結(jié)果顯示,在線DPO訓練顯著提高了Flow的泛化能力。

對于Llama-3-8B-Instruc模型,在線DPO學習在僅2000個訓練實例內(nèi)將Flow的性能提高了20%。對于Phi-3-medium-128k-instruct模型,在線DPO學習使其準確率提高了4個百分點,達到了83%.

Image

2.推理軌跡質(zhì)量

Flow生成的推理軌跡在質(zhì)量上也優(yōu)于基線和模型生成的正確推理軌跡。

對于Llama-3-8B-Instruct模型,F(xiàn)low生成的推理軌跡在GSM8K和MATH數(shù)據(jù)集上的微調(diào)準確率分別提高了6%和7.8%。

對于Phi-3-medium-128k-instruct模型,F(xiàn)low生成的推理軌跡在兩個數(shù)據(jù)集上的微調(diào)準確率分別提高了1.9%和2.1%.

Image

除了剛開始的垂直直線問題,研究團隊還放出了很多真實的解題回答和對比,感興趣的朋友可以查看論文的更多相關信息。

Image

沒想到,不久前還讓LLM非常頭疼的數(shù)學問題現(xiàn)在也進步飛快!

有了優(yōu)秀的邏輯分析能力,我們也能期待LLM未來能解決更多復雜的問題了。

Image

參考鏈接:
[1]https://arxiv.org/abs/2410.22304

版權所有,未經(jīng)授權不得以任何形式轉(zhuǎn)載及使用,違者必究。
成人网在线免费视频| 国产精品视频在线观看免费| 亚洲精品91在线| 欧美人妻一区二区三区| 91视频免费看片| 欧美日韩成人免费观看| 国产亚洲色婷婷久久99精品| 中文字幕精品无码一区二区| 波多野结衣理论片| 日韩一级片免费| 日韩av网站在线观看| 麻豆精品视频在线观看免费| 99国产精品久久久久久久久久久| 欧美激情一二三区| 亚洲h在线观看| 欧美性猛交xxxx免费看久久久| 欧美精品在线视频| 亚洲日本中文字幕免费在线不卡| 久久亚洲欧美日韩精品专区| 国产精品27p| 黄色一区三区| 拔插拔插海外华人免费| 奇米777在线视频| 国产91丝袜美女在线播放| 国产无遮挡又黄又爽在线观看| 国产一区二区波多野结衣| 男人操女人的视频在线观看欧美 | 999在线观看| 亚洲天堂岛国片| 中文人妻av久久人妻18| 久久国产一二区| 91在线porny国产在线看| 精品久久久久久久大神国产| 亚洲成人精品久久久| 久久在线免费观看视频| 成人在线观看网址| 日本www在线视频| 亚洲图片综合网| 中文字幕高清在线免费播放| 麻豆精品精品国产自在97香蕉| 国产精品成人在线观看| 在线播放中文一区| 日韩在线视频一区| 国产精品区二区三区日本| 黄页网站在线观看视频| 无码国产69精品久久久久同性| 免费av网站在线| 蜜臀av一级做a爰片久久| 亚洲欧洲99久久| 亚洲激情小视频| 日本一欧美一欧美一亚洲视频| 亚洲午夜高清视频| 中文字幕无人区二| www.久久网| 白白色亚洲国产精品| 欧美唯美清纯偷拍| 97人人做人人爱| 亚洲高清123| 日本69式三人交| 99久久精品国产一区色| 综合色中文字幕| 亚洲欧美国产精品久久久久久久| 91超碰在线免费观看| 性猛交ⅹ×××乱大交| 日日夜夜狠狠操| www激情久久| 亚洲国产精品久久91精品| 亚洲xxx大片| 日本在线观看视频一区| 国产一区二区三区视频免费观看| 日本一区二区三区在线观看| 一本色道久久综合狠狠躁篇的优点| 国产富婆一区二区三区| 成人午夜精品无码区| 精品人妻一区二区三区日产乱码| 中文字幕中文字幕中文字幕亚洲无线| 日韩电影网在线| 美女一区视频| 中文字幕第24页| 国产精品一区三区| 精品福利一区二区三区免费视频| 91在线视频一区| 欧美激情一区二区三区p站| 亚洲福利在线观看视频| 红桃av永久久久| 日韩美女写真福利在线观看| 色免费在线视频| 亚洲av永久无码国产精品久久| 一区二区欧美精品| 青青久久aⅴ北条麻妃| 不卡av免费在线| 中文字幕码精品视频网站| 亚洲已满18点击进入久久| 久久久久久久影院| 免费网站在线观看黄| 亚洲精品无码专区| 91麻豆精品国产91久久久使用方法 | 美女视频一区免费观看| 欧美美女网站色| 国产精品免费观看高清| 天堂久久精品忘忧草| 风流少妇一区二区| 久久久精品国产亚洲| 久久无码高潮喷水| 日本波多野结衣在线| 91精品欧美一区二区三区综合在| 黑人巨大精品欧美一区二区小视频| 国产aⅴ激情无码久久久无码| 国产69精品久久777的优势| 在线观看亚洲视频| 一级黄色香蕉视频| 日本少妇一区二区| 国产亚洲欧美日韩一区二区| 日本男女交配视频| hs视频在线观看| 亚州成人在线电影| 久久久久se| 青娱乐在线视频免费观看| 亚洲品质自拍视频| 18成人免费观看网站下载| 日韩av毛片在线观看| 亚洲同性gay激情无套| 国产又爽又黄的激情精品视频| 久久丫精品忘忧草西安产品| 久久久久久99久久久精品网站| 欧美一区二三区| 免费看91的网站| 亚洲日穴在线视频| 国产精品一区在线播放| 日韩精品一区二区不卡| 欧美日韩精品三区| 国产在线xxxx| 久久久噜噜噜| 久久91亚洲人成电影网站| 艳妇乳肉豪妇荡乳xxx| 久久你懂得1024| 国产日韩欧美在线播放| 日本天堂网在线观看| 欧美色综合影院| 91九色国产ts另类人妖| 午夜视频免费看| 日韩有码在线播放| 亚洲麻豆一区二区三区| 综合自拍亚洲综合图不卡区| 青青草原亚洲| 天天干视频在线观看| 久久精品久久久久电影| 一级性生活大片| 亚洲成人一区在线| 女同性恋一区二区| 久久精品国产99久久6| 日av在线播放中文不卡| 久久综合色综合| 在线播放91灌醉迷j高跟美女 | 欧美大码xxxx| 国产精品av久久久久久无| 日本高清免费不卡视频| 欧美日韩成人免费视频| 99久久精品免费看| 国产精品v欧美精品∨日韩| 国产又粗又猛又爽又黄91| 中文字幕亚洲专区| 欧美黄色高清视频| 欧美日韩国产片| 女人另类性混交zo| 欧美激情一二三区| 亚洲 欧洲 日韩| 国产盗摄一区二区三区| 91文字幕巨乱亚洲香蕉| 亚洲男人第一天堂| 91精品国产高清自在线看超| 国产 日韩 欧美 在线| 日韩成人性视频| 国产熟女一区二区| 6080yy午夜一二三区久久| 中文字幕日韩综合| 婷婷成人激情在线网| 成人av一级片| 亚洲色图20p| 男人添女人下面高潮视频| 91老师国产黑色丝袜在线| 天天综合狠狠精品| 国产1区2区3区精品美女| 欧美一区二区高清在线观看| 国产美女视频一区| 久久久影院一区二区三区 | 日韩激情av在线播放| 一区二区三区伦理片| 精品久久一区二区三区| 亚洲天堂久久新| 欧美精品一区二区久久婷婷| 少妇视频一区二区| 中文字幕在线成人| 日韩免费av网站| 国语自产精品视频在线看| 视频一区二区三区四区五区| 欧美高清不卡在线| 一级特黄色大片| 国产精品久久久久久亚洲调教| 精品国产乱码一区二区三 | 在线观看视频一区二区| 亚洲妇女无套内射精| 欧美一区欧美二区| 午夜三级在线观看| 久久国产精品久久精品| 国产麻豆精品一区| 亚洲直播在线一区| av电影在线观看完整版一区二区| 在线视频一区观看| 亚洲精品久久久蜜桃| 日韩欧美理论片| 欧美xxx久久| 国产女同在线观看| 国产精品十八以下禁看| 国产在线精品免费av| 伊人狠狠色丁香综合尤物| 亚洲欧美日韩中文播放| 中文字幕无人区二| 中文字幕一区电影| 精品人妻无码一区二区| 欧美日韩一区在线视频| 国产精品成人一区二区艾草 | 亚洲性图第一页| 91超碰这里只有精品国产| 国产黄色的视频| 精品自在线视频| 人人狠狠综合久久亚洲| 一区二区日本伦理| 狠狠色狠狠色综合日日五| 国产传媒在线看| 久久大大胆人体| 三级小视频在线观看| 亚洲人成网站在线播放2019| 亚洲成av人片一区二区| 国产黄色片在线| 日本欧美精品在线| 成人一级片网址| 最新中文字幕免费视频| 亚洲国产精品久久久久秋霞蜜臀| 无码日韩精品一区二区| 国产一区免费| 一区二区三区精品在线| 国产全是老熟女太爽了| 久久免费视频观看| 国产一区二区精品久久91| 国产主播在线看| 日韩精品免费视频| 国内精品偷拍视频| 免费cad大片在线观看| 欧美疯狂性受xxxxx喷水图片| 欧美不卡视频在线观看| 肥熟一91porny丨九色丨| 国产精品免费网站在线观看| 亚洲综合自拍网| 久久人人爽人人爽人人片av高请| 国产裸体歌舞团一区二区| xxww在线观看| 久久精品国产96久久久香蕉| 久久99国产精品久久99 | 粉嫩精品一区二区三区在线观看| 国产精品久久二区二区| sm捆绑调教视频| 91在线国产电影| 一区二区三区在线观看视频| 欧美成人精品一区二区免费看片| 成人在线精品视频| 亚洲精品高清在线| 欧美日韩在线观看成人| 国产成人免费电影| 色av成人天堂桃色av| 亚洲熟妇无码久久精品| 8x8ⅹ国产精品一区二区二区| 欧美一区二区三区人| 国产刺激高潮av| 91激情视频在线| 欧美成人免费在线观看| 26uuu亚洲综合色欧美| 蜜桃av免费在线观看| 国产伦精品一区二区三毛| 欧洲激情一区二区| 性猛交xxxx乱大交孕妇印度| 欧美黄色一级片视频| 久久亚洲精品小早川怜子66| 2024国产精品| 精品无码免费视频| 一区二区不卡在线视频 午夜欧美不卡' | 欧美精品18videos性欧美| xnxx国产精品| 久久久www成人免费毛片| 日韩欧美一区二区视频在线播放| 欧美精品视频www在线观看| 久久亚洲精品伦理| xfplay5566色资源网站| 91aaaa| 欧美一二三区在线观看| 九色综合狠狠综合久久| 免费黄色在线视频| 国产自产在线视频一区| 337p日本欧洲亚洲大胆精品| 国产不卡视频一区二区三区| 天天做夜夜爱爱爱| 一区二区视频国产| 欧美成人激情视频| 亚洲免费在线看| 国产一区二区在线不卡| 国产一级片中文字幕| 91久久久久久久久久久久久| 欧美日韩亚洲综合在线 | 91精品国产闺蜜国产在线闺蜜| 欧美日韩免费高清| 亚洲欧美在线一区二区| 国产精品国产自产拍高清av | 污片在线观看一区二区| 色婷婷综合视频| 一区二区三区伦理片| 手机在线视频你懂的| 欧美日韩国产成人在线| 亚洲高清视频的网址| 日韩国产高清影视| 日日噜噜夜夜狠狠久久波多野| 97超碰在线视| 日韩av免费在线看| 欧美日韩不卡在线| 不卡欧美aaaaa| 成人黄色三级视频| 亚洲一区二区图片| 色噜噜狠狠一区二区三区| 久久网福利资源网站| 日韩欧美中文第一页| 国产一区二区视频在线播放| 日韩和一区二区| 永久免费黄色片| 日韩高清av电影| …久久精品99久久香蕉国产| 4438成人网| 国产精品理论片| 日本特黄久久久高潮| 精品欧美一区二区三区免费观看 | 国产又黄又大又粗的视频| 日韩精品人妻中文字幕有码| 男人的天堂成人| 国产在线不卡精品| 亚洲人成伊人成综合网久久久| 亚洲同性gay激情无套| 九九视频精品免费| 一区二区视频免费| 超碰人人人人人人人| 久久久久久久少妇| 欧美人与物videos另类| 91国产精品电影| 亚洲精品一区二区在线观看| 一区二区不卡在线视频 午夜欧美不卡在 | 国产精品333| 蜜桃91精品入口| 性欧美xxxx视频在线观看| 精品国产制服丝袜高跟| 亚洲一本大道在线| 97se亚洲国产综合在线| 首页亚洲欧美制服丝腿| 中日韩av在线| 欧美日韩在线视频免费| 精品人妻一区二区免费| 成人黄色av片| 亚洲午夜精品一区二区三区| 国产中文字幕日韩| 久久人91精品久久久久久不卡| 亚洲精品在线免费播放| 色成年激情久久综合| 亚洲视频在线一区观看| 91一区二区三区在线播放| 奇米精品一区二区三区四区| av中文字幕免费在线观看| 国产a∨精品一区二区三区仙踪林| 成人影视免费观看| 中文字幕 欧美 日韩| 国产精品69页| 久久人人爽人人爽人人av| 亚洲一二三区精品| 久久亚裔精品欧美| 91青青草免费在线看| 国产精品久久久久国产a级| 久久天天躁狠狠躁夜夜爽蜜月 | av亚洲精华国产精华精华| 久久97超碰国产精品超碰| 亚洲欧美综合一区二区| 在线观看免费视频a| 国产视频91在线| 黄色小说在线观看视频| 久久爱一区二区| 91成人精品一区二区| 中文字幕高清视频| 岛国精品资源网站| 亚洲精品无码一区二区| 性生交大片免费看l| 网站在线你懂的| 91小视频在线播放| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| 免费看日本黄色| 日韩精品在线中文字幕| 日韩中文在线字幕| 在线观看17c| 免费在线黄网站| 国产 日韩 欧美在线| 日韩视频免费播放| 97超碰在线人人| 老太脱裤子让老头玩xxxxx| 日本a视频在线观看| 国产h视频在线播放| 人人干人人视频| 一区二区三区四区影院|