色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

超級對齊團隊“遺作”

夢晨 發自 凹非寺
量子位 | 公眾號 QbitAI

OpenAI突然發布新模型!基于GPT-4訓練,可以幫助下一代GPT訓練。

CriticGPT,用于給代碼挑Bug時能找到75%以上,而相比之下人類只能找到不到25%。

它還可以給Bug寫“銳評”,在60%的情況下人類訓練師更喜歡有CriticGPT幫助下的批評。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

有網友開玩笑說,“只會批評的GPT,這不是我前妻么”。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

但這項研究最重要之處在于,CriticGPT挑錯能力可以泛化到代碼之外。

比如在RLHF訓練中給AI的輸出挑錯,而且已經進入OpenAI內部訓練流程。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

更好的RLHF就能訓練出更強的模型,更強的模型又能通過更好地挑錯來增強RLHF訓練……

論文結論中赫然寫道:在真實世界數據中挑錯誤上,AI還可以繼續進步,人類智能已經到頭了。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

左腳踩右腳上天,難道真的被這幫人給搞出來了?

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

這是一篇來自被解散的超級對齊團隊的“遺作”,由前負責人Jan Leike帶隊。

而Leike本人已經跳槽去了隔壁Anthropic,繼續做這類研究。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

基于GPT-4,改進GPT-4

OpenAI官網文章變相承認了,GPT-4之后這么久沒有大的改進,還真的遇到一些瓶頸:

隨著AI能力變強,它犯的錯也不那么顯眼了,人類訓練師都難以發現不準確之處。

人類給不出反饋,那RLHF“人類反饋強化學習”就無從談起了。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

CriticGPT正是為了應對這一挑戰而生。

CriticGPT基于GPT-4,也接受了RLHF訓練出,但特別之處在于訓練數據中包含大量的錯誤輸入。

具體來說,分為三步:

  1. 讓人類標注員在ChatGPT生成的代碼里故意植入一些微妙的bug。
  2. 標注員扮演代碼審查員的角色,寫下他們對這些bug的評論。
  3. 用這些數據來訓練CriticGPT,讓它學會如何發現和指出代碼中的問題。
OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

在具體訓練過程中,他們還玩了點花樣。

比如不斷讓標注員驗證自己插入的bug是否足夠隱蔽,能夠騙過當前版本的CriticGPT。這樣一來,CriticGPT就被迫不斷進化,學會發現越來越隱蔽的問題。

思路有點像GAN的左右互搏,只不過生成器這個位置是人類來充當的……

最后,OpenAI還使用了一種“強制采樣束搜索”(FSBS)的技術,允許CriticGPT在生成評論時既能保持全面,又能減少”幻覺”和“雞蛋里挑骨頭”現象。

具體來說,FSBS會強制模型生成多個不同的評論片段,用獎勵模型對這些片段進行評分,最后根據評分和一個長度修正因子來選擇最佳的評論組合。

通過調整長度修正因子,可以在評論的全面性和準確性之間找到最佳平衡點,既不會錯過重要問題,又不會過度挑剔。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

等一下,推理時搜索,這不正是和傳聞中的Q*一個思路,這次居然寫到了論文里。

可能是看外部團隊(如顏水成)按這一思路的研究已經夠多了,就不再藏著掖著了。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

說回到CriticGPT,取得了哪些結果呢?

  • 在發現人為插入的bug方面,人類審核員平均只能找到25%,而CriticGPT的成功率高達75%以上
  • 在評估自然出現的Bug時,有63%的情況下人類更傾向于選擇CriticGPT的評論而非人類評論
  • CriticGPT的評論被認為比ChatGPT的更全面,更少出現”幻覺”和無關緊要的挑剔
  • 在評估非代碼任務時,成功識別出數百個在ChatGPT訓練數據中被人類認為是”完美”的錯誤。

不過CriticGPT也不是十全十美,它也會有”幻覺”問題,指出一些實際上不存在的問題。

目前,人類和CriticGPT組隊工作效果最好:既能發現大部分問題,又能避免AI的”幻覺”。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

RLHF上限不再是人類

對于CriticGPT,負責這項研究的Jan Leike也補充了他自己的一些看法。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

RLHF是創造出ChatGPT的核心技術之一,但隱患在于人類能力就是RLHF的天花板。

當需要AI去解決人類無能為力的任務時,人類給不出相應反饋,AI也就無法改進了。

CriticGPT的成功,意味著超級對齊團隊設想中的可擴展監督,也就是用弱模型監督訓練更強的模型,終于有希望了。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

不過他也透露,目前CriticGPT并沒有幫助人類顯著提高艱難任務上的準確性,但是框架有了只要有更好的預訓練模型就能不斷改進。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

為什么先從代碼任務開始入手呢?

一方面,代碼任務有現實意義,做出來的模型可以直接用上。

另一方面,代碼可以清晰明確的評估,比開放式對話更客觀,更容易評估CriticGPT發現的問題是否真實和重要。

結果CriticGPT在代碼上訓練,卻不僅能挑代碼Bug,還給1/4的ChatGPT生產數據挑出了問題。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

最后,由于原OpenAI超級對齊團隊已經解散,已經跳槽的Jan Leike插入了一條Anthropic招聘廣告:

想做后續研究的請去隔壁。

也是讓人不得不感嘆硅谷是真的沒有競業協議。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

One More Thing

同日,谷歌發布了開源大模型Gemma 2,OpenAI趕緊甩出一條消息來狙擊,這都第幾次了。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

對于甩出來的不是Sora公測或者GPT-4o完整語音、視頻模式,也有很多人不滿。

有網友提了個更好的主意:

做個ReleaseGPT,專門用來發布承諾好的更新吧。

OpenAI突發新模型:用GPT改進GPT訓練,左腳踩右腳登天,RLHF突破人類能力上限

不過這次OpenAI久違的放出了論文,也還算有一些誠意。

論文地址:
https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf

參考鏈接:
[1]https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/
[2]https://x.com/janleike/status/1806386442568142995

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
亚洲国产激情av| 久久国产高清视频| 欧美日韩国产999| 国产精品久久网站| 久久亚洲二区三区| 日本一区二区三区视频视频| 亚洲人成色777777老人头| 992kp快乐看片永久免费网址| 日韩在线欧美在线| 中文字幕丰满人伦在线| av免费中文字幕| 一区二区三区四区不卡视频| 欧洲av在线精品| 色一情一乱一伦一区二区三欧美 | 免费不卡的av| 91av俱乐部| 九九精品在线观看视频| 国产伦精品一区二区三区免费迷 | 亚洲靠逼com| 强乱中文字幕av一区乱码| 国产a级黄色大片| 成人免费视频91| 精品噜噜噜噜久久久久久久久试看| 国产破处视频在线观看| 成人黄动漫网站免费| 精品女厕一区二区三区| 亚洲美女在线观看| 国产一区二区久久精品| 亚洲精品aⅴ中文字幕乱码| 日韩精品视频在线观看免费| 国产精品v欧美精品v日韩精品| 无码内射中文字幕岛国片| 欧美国产在线看| 欧美一级黄视频| 国产日产在线观看| 黑森林av导航| 欧美美女一级片| 国产网站欧美日韩免费精品在线观看| 国产免费美女视频| 蜜桃传媒视频麻豆第一区免费观看 | 国产日韩视频在线观看| 国产精品大片wwwwww| 国产精品高潮呻吟久久av无限 | 91精品中国老女人| 成人性生交免费看| 日韩在线 中文字幕| 激情视频在线播放| 国模私拍在线观看| 男人添女人荫蒂国产| 欧美在线一级片| 69久久夜色精品国产69乱青草| 国产人成亚洲第一网站在线播放| 五月婷婷中文字幕| 日本 片 成人 在线| 亚洲国产精品123| 欧美极品欧美精品欧美图片| 中文字幕乱视频| 国产又粗又猛又黄| 精品sm捆绑视频| 欧美精品成人网| 成人动漫视频在线| 欧美视频精品一区| 一区二区视频在线| 欧美性大战久久久久久久蜜臀| 亚洲精品第一页| 在线不卡欧美精品一区二区三区| 26uuu精品一区二区在线观看| 日韩一级在线观看| 久久成人av网站| 久久精品二区| 性爱在线免费视频| 久久久久久久香蕉| 亚洲精品在线观看av| 久久影音资源网| 成人欧美一区二区三区黑人孕妇 | 欧美日韩成人一区| 性欧美亚洲xxxx乳在线观看| 精品一区在线播放| 青少年xxxxx性开放hg| 国内av免费观看| 亚洲欧美卡通动漫| 成人黄色片免费| 精品在线视频一区二区三区| 国产精品久久久久久久久久久不卡 | 国产男女裸体做爰爽爽| 亚洲免费在线观看| 在线观看欧美一区| 天堂av手机版| 日韩一卡二卡三卡四卡| 性欧美办公室18xxxxhd| 中文字幕亚洲乱码| 国模无码一区二区三区| 亚洲香肠在线观看| 首页国产欧美日韩丝袜| 精品国产av一区二区| 亚洲综合精品视频| 国产视频一二三四区| 亚洲激情 国产| 亚洲xxxx18| 嫩草视频免费在线观看| 日韩不卡视频在线| 九九九国产视频| 精品久久久久久久久久| 色与欲影视天天看综合网| 日韩成人手机在线| 国产精品伊人久久| 一本大道久久a久久综合婷婷| 亚洲一区二区中文字幕| 熟女少妇内射日韩亚洲| 久久久综合视频| 91精品国产乱码久久久久久蜜臀| 国产欧美精品一二三| 久久99蜜桃精品| 中文字幕久热精品在线视频| 毛片av免费在线观看| 丝袜亚洲精品中文字幕一区| 亚洲欧美成人一区二区在线电影| 免费看国产一级片| 米奇777在线欧美播放| 精品在线欧美视频| 色诱视频在线观看| 国内一区二区在线| 国内精品美女av在线播放| www.欧美com| 91麻豆国产在线观看| 97av在线播放| 国产又粗又猛又爽又黄的视频小说| 久久久久国产免费免费| 国产乱肥老妇国产一区二| 国产精品免费人成网站酒店| 欧美亚洲高清一区二区三区不卡| 精品视频导航| 懂色av蜜臀av粉嫩av分享吧最新章节| 色视频成人在线观看免| 杨幂一区欧美专区| 天天操天天舔天天干| 在线精品91av| 亚洲精品在线视频免费观看| 国产欧美日韩另类视频免费观看| 国产精品日韩久久久久| 青草草在线视频| 欧美性淫爽ww久久久久无| 中文字幕黄色大片| 男女男精品网站| 久久久久久久久久久网站| av女人的天堂| 亚洲人成精品久久久久久| 免费看污久久久| 天堂中文资源在线观看| 欧美精品电影在线| 免费人成在线观看| 7777精品伊人久久久大香线蕉经典版下载 | 在线视频免费观看一区| 精品伊人久久97| 538国产视频| 都市激情亚洲色图| 亚洲国产精品久久久久婷蜜芽| 国产自产v一区二区三区c| 国产精品av在线播放| 国产亚洲欧美在线精品| 国产丝袜一区二区| 精品国产一区在线| 欧美午夜激情在线| 日本男人操女人| 国产女人18毛片水真多成人如厕 | 久久一级黄色片| 欧美一级二级三级乱码| 香蕉视频xxxx| 天天操天天色综合| 一区二区三区国产免费| 国产精品国产馆在线真实露脸| 亚洲高清在线播放| av综合在线播放| 日韩福利一区二区三区| 国产精品自拍网站| 欧美第一黄网| 国产91精品精华液一区二区三区 | 亚洲国产精品久久久| 欧美xxxxx少妇| 色婷婷综合久久| av在线免费看片| 午夜a成v人精品| 中文字幕国内自拍| 色综合久久久久综合体桃花网| 国产一二三区av| 亚洲福利视频一区二区| 国产免费又粗又猛又爽| 色综合网色综合| 丰满少妇中文字幕| 3d成人动漫网站| 亚洲精品国产一区黑色丝袜| 亚洲国产另类久久精品| 91高清免费观看| 伊人精品在线观看| 日韩三级视频在线| 久久久久久91香蕉国产| 国产精品久久久久久69| 成人黄色av网站| 日韩电影网1区2区| 三区精品视频观看| 国产精品成人网| 制服丝袜综合网| 欧美日韩国产成人在线91| 黄色片在线观看免费| 中文字幕av日韩| 91片黄在线观看喷潮| 国产精品一区二区三区久久久| 视频一区视频二区中文| 蜜桃视频在线观看91| 久久精品一区八戒影视| 50路60路老熟妇啪啪| 欧美午夜宅男影院| 日本在线一级片| 久久久久久美女| 手机看片1024国产| 日本精品免费| 中文字幕亚洲精品在线观看 | 九色综合婷婷综合| 国产亚洲一本大道中文在线| 日本人视频jizz页码69| 欧美一区国产二区| 日本免费在线观看视频| 成人免费网站在线观看| 成人av午夜影院| 三级a在线观看| 亚洲福利视频网| 中文字幕 自拍偷拍| av资源站久久亚洲| 国产精品美女久久久久久久久| 激情久久综合网| 国产亚洲精品久久久优势| 亚洲乱码在线观看| 自拍偷拍视频在线| 欧美私人免费视频| 中文字幕精品三级久久久 | 亚洲精品国产品国语在线| 国内自拍视频在线播放| 成人在线免费观看一区| 成人欧美一区二区三区视频网页 | 日本成人看片网址| 偷偷要91色婷婷| 久久福利免费视频| 国产精品视频永久免费播放 | 国产人妖一区二区三区| 欧美另类一区| 欧美日韩精品在线播放| 97成人资源站| 成人黄色av播放免费| 中文字幕亚洲区| 国产三级黄色片| 国产精品久久9| 国产亚洲一区二区三区| 欧美大波大乳巨大乳| 欧美性视频精品| 成人激情综合网站| 午夜不卡久久精品无码免费| 2021国产精品视频| 久久精品一区二区三区不卡 | 黄色三级中文字幕| 日韩精品在线视频美女| 美日韩一区二区| 日本亚洲一区二区三区| 久久久视频免费观看| 26uuu精品一区二区| 久久免费手机视频| 91精品国产综合久久香蕉922| 亚洲丝袜自拍清纯另类| 久操视频免费在线观看| 欧美久久久久久久| 欧美日韩在线不卡| 国产77777| 制服丝袜中文字幕第一页 | 色综合av在线| 国产人妖在线播放| 国产福利视频在线播放| 欧美成人小视频| 国产清纯白嫩初高生在线观看91| 2014亚洲天堂| 欧洲精品亚洲精品| 精品sm捆绑视频| 免费成人美女在线观看| 国产伦精品一区二区免费| 欧美专区福利在线| 亚洲成av人片在线| 国产成人三级在线播放| mm1313亚洲国产精品无码试看| 色综合91久久精品中文字幕 | 国产国语亲子伦亲子| 密臀av一区二区三区| 97久久国产精品| 一区二区高清免费观看影视大全| 一区二区视频网| 黄色免费网址大全| 国产精品美女久久久久av超清| 欧美日韩国产色| 久久久久国产一区二区| 免费的av网站| 欧美日本韩国一区二区三区| 精品亚洲va在线va天堂资源站| 99久久国产综合色|国产精品| 全网免费在线播放视频入口| 玖玖精品在线视频| 欧美高跟鞋交xxxxhd| 亚洲国产一区二区视频| 狠狠躁日日躁夜夜躁av| 久草视频福利在线| 欧洲亚洲一区二区三区四区五区| 亚洲人成在线观看| ...av二区三区久久精品| 一级黄色小视频| 催眠调教后宫乱淫校园| 欧美成人免费在线| 欧美成人免费小视频| 香蕉影视欧美成人| 看片的网站亚洲| 国产精品99精品| 美女少妇一区二区| 国产日韩久久| 久久久91精品国产一区不卡| 亚洲最大色网站| 久久青草久久| 久久免费视频播放| 日韩精品一区二区三区色欲av| 亚洲va欧美va在线观看| 国产性色av一区二区| 午夜在线电影亚洲一区| 激情都市一区二区| 中文字幕激情小说| 2018国产精品| 中文字幕成人一区| 青青久久av北条麻妃海外网| 欧美大片在线观看一区二区| 国产夜色精品一区二区av| 99在线小视频| 草视频在线观看| 天天av天天操| 一二三四中文字幕| 成人av资源网| 国模精品系列视频| 亚洲精品久久久久久下一站| 亚洲自拍偷拍网站| 成人性生交大合| 亚洲成人av综合| 男人的天堂一区| 国产精品无码永久免费不卡| 欧美视频免费看欧美视频| 亚洲综合成人婷婷小说| 另类色图亚洲色图| 亚洲成人av在线| 色屁屁一区二区| 亚洲天堂免费在线观看视频| 国产成人午夜视频| 欧美特黄一级视频| 9i看片成人免费看片| 日本少妇xxxxx| 久久精品亚洲天堂| 国产freexxxx性播放麻豆| 国内成+人亚洲| 国产精品美女久久久久久免费| 色哟哟入口国产精品| 精品欧美一区二区久久| 日韩欧美国产激情| 国产精品国产自产拍在线| 激情另类小说区图片区视频区| 国产 日韩 欧美 综合| 亚洲图片在线播放| 欧美激情亚洲综合| 精品无码一区二区三区蜜臀| 波多野结衣福利| 性高潮免费视频| 一区二区久久精品| 欧美 日韩精品| 在线成人性视频| 日本一区二区三区精品视频| 动漫精品视频| 91色在线观看| 国产成人自拍视频在线观看| 久久高清视频免费| 日韩在线观看免费全集电视剧网站 | 国产夫妻在线观看| 日韩精品一区不卡| 伊人手机在线视频| 六月丁香在线视频| 日本三级午夜理伦三级三| 五月天丁香激情| 中文字幕av久久爽av| 国产中文字幕久久| 五月天婷婷丁香网| 少妇愉情理伦三级| 91视频免费在观看| 在线观看日本中文字幕| 公侵犯人妻一区二区三区| 欧美性xxxx图片| 三上悠亚ssⅰn939无码播放| 国产三级国产精品| 精品无人区无码乱码毛片国产| 中文字幕精品久久久| 91精品人妻一区二区| 免费观看a级片| 日本激情视频一区二区三区| 性欧美videos| 日韩精品乱码久久久久久| 亚洲天堂一区在线| 中文字幕在线观看视频免费| 亚洲精品一区二区二区| 91午夜交换视频| 亚洲欧美自偷自拍| 国产成人综合网站| 久久色在线视频| 中文字幕视频一区|