色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

<dl id="oo309"></dl>

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

西風 2025-02-19 09:25:43 來源：量子位

網友：沒人比他倆更了解ChatGPT后訓練的事兒

西風發自凹非寺

量子位 | 公眾號 QbitAI

離開OpenAI后，他們倆把ChatGPT后訓練方法做成了PPT，還公開了～

正如網友所言，可能沒有人比他倆更了解ChatGPT后訓練的事兒。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

畢竟，一位是OpenAI聯合創始人，曾經也是OpenAI后訓練共同負責人的John Schulman，另一位是曾經在OpenAI當后訓練研究VP的Barret Zoph。

John Schulman發推文稱：

啊，我和Barret Zoph最近在斯坦福做了一場關于后訓練以及分享開發ChatGPT經驗的演講，可惜沒被錄下來，但我們有PPT。

順便又全網尋錄音/視頻“如果你有錄音，請告訴我！”

網友不語，只是一味點贊收藏。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

有曾在現場的網友親證，演講質量真不戳。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

還有網友在感謝完倆人后想要更多：

如果能分享更多關于訓練后階段的最新進展，比如推理模型、DeepSeek RL等，那就太好了。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

這次先來看看PPT長啥樣～

ChatGPT后訓練方法PPT版

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

先是自我介紹。

Barret Zoph和John Schulman曾在OpenAI共同擔任后訓練聯合負責人，從2022年9月開始合作，主要目標是開發一個對齊的聊天機器人，最初的團隊被稱為“RL”，只有少數幾個人。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

接著介紹了后訓練（Post-Training）階段是什么：

后訓練階段是模型開發的最后一步，目的是讓模型更像一個助手，遵循特定格式，并確保其適合實際生產環境，這一階段通常與產品團隊緊密合作。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

用幾個具體例子，對比基礎模型和后訓練模型的區別：

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

后訓練VS預訓練總的來說：

計算資源需求更低，迭代周期更快；使用基于人類反饋的強化學習（RLHF）；教模型使用工具；塑造模型個性；引入拒絕/安全行為；行為嚴重依賴預訓練階段的泛化能力。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

后訓練包含三個主要組成部分：監督微調（SFT）、獎勵模型（RM）訓練、強化學習（RL）。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

以下是三個組成部分的具體介紹：

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

隨后回顧了ChatGPT和OpenAI后訓練的早期發展歷程。

包括GPT-3、GPT-3.5的發布、RL團隊的工作、GPT-4的準備過程、決定發布ChatGPT的細節以及發布后意外成功，實現病毒式傳播。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

ChatGPT曾一度被大批涌來的用戶擠崩：

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

隨時間推移，ChatGPT模型和功能逐漸更加復雜和多樣化：

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

2022年12月最初版本和2025年1月版本的對比：

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

添加了許多功能：

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

然后講了在功能擴展和公司規模增長的背景下，如何通過主線模型（mainline model）設置來整合變化并降低風險，包括在較小規模上測試；在頻繁的更新中逐步整合更改，如果發現問題能夠迅速回滾到之前的版本。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

在這當中也出現了一些失誤和挑戰……

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

比如模型在生成文本時出現了很多拼寫錯誤。

強化學習（RL）后發現拼寫錯誤率有所上升，在監督微調（SFT）數據集中發現了拼寫錯誤的提示。

最終通過對比過程改進，將兩個生成的文本（completion 1和completion 2）進行比較，選擇改進后的版本，專家會對比這兩個文本，有時會寫出改進后的版本。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

此外還有過度拒絕的情況。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

早期的拒絕行為過于冗長：

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

有一些方法比如通過改變時態，可以繞過模型的拒絕機制。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

倆人隨后講解了為何拒絕行為難以處理，有邊界問題和人類數據問題。

解決方案包括配對數據、有針對性的邊界示例、對標注數據進行分層處理。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

另外，模型還會出現偏見。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

還可能會生成虛假或誤導性的內容。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

在涉及品味、主觀性和高投入的任務中，如何獲取高質量人類反饋也是一大挑戰。

通過人類與AI團隊協作進行標注是解決方案之一。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

他們還探討了不同來源的人類反饋在提示多樣性、標簽質量、領域、正確性、意圖和合規性等方面的優缺點，并提出了如何利用它們各自優勢問題。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

而要讓模型按照我們的意愿行事，第一步是弄清楚我們想要什么。

倆人表示這一步出乎意料的難，要明確規范。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

OpenAI2024年5月發布了模型規范。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

還有一個開放性問題，如何保持模型多樣性和趣味性。

兩人提到通過后訓練迭代和模型蒸餾來保持或強化這些特性。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

總結了以InstructGPT、Llama 3.1等為代表的“兩個時代”的模型訓練流程，包括從基礎模型到對齊模型的訓練步驟，最終目標是生成一個經過多次優化的對齊模型。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

提出了一個開放性問題，探討如何在模型訓練和優化過程中恢復并保持基礎模型中的多樣性和趣味性，包括不同的風格和世界觀。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

最后他們推薦了一些關于后訓練的論文和blog：

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

倆人都被OpenAI前CTO挖走了

John Schulman和Barret Zoph離開OpenAI后，現在都在干什么——

被曝雙雙加入了OpenAI前CTO Mira Murati的新創業團隊Thinking Machines Lab。

Mira Murati去年9月官宣離職OpenAI，離職后不久，就在10月份，她被曝籌備新公司/AI實驗室，吸金超1億美元。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

Mira Murati已經挖到了20多位頂尖研究員和工程師投奔，都是來自OpenAI、谷歌、Anthropic等巨頭。

這其中就包括Jonathan Lachman和Barret Zoph。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

John Schulman去年8月離開的OpenAI，先是加入了OpenAI競爭對手Anthropic，致力于LLM的對齊工作，短短六個月后再次離職，加入了Murati的創業項目，擔任首席科學家。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

至于Barret Zoph，去年9月份和Mira Murati幾乎同時離職，隨后就加入了Mira Murati的團隊，擔任CTO。

ChatGPT后訓練方法被OpenAI離職聯創公開，PPT全網轉～

參考鏈接：
[1]https://x.com/johnschulman2/status/1891539960743743756
[2]https://www.businessinsider.com/openai-employees-joining-mira-murati-new-startup-2025-2#john-schulman-1

版權所有，未經授權不得以任何形式轉載及使用，違者必究。

ChatGPT 后訓練

相關閱讀

現場拔網線！第四范式版GPT能力首秀，有點不一樣

“閉卷”交作業

十三2023-04-26

AIGS ChatGPT 式說第四范式

每周7億人都在如何用ChatGPT？OpenAI最全報告來了

OpenAI&哈佛大學經濟學家出品

一水2025-09-16

ChatGPT

ChatGPT設計的游戲火了！玩法代碼一力搞定，自稱「原創」卻被指：抄襲了

在線可玩

魚羊2023-03-12

ChatGPT 游戲設計

大模型實時打《街霸》捉對PK，GPT-4居然不敵3.5，新型Benchmark

考研速度和性能的平衡

夢晨2024-04-01

ChatGPT 大模型

ChatGPT最近被微軟內部禁用！GPTs新bug：數據兩句話就能套走

馬斯克：GPT-Snore

衡宇2023-11-11

ChatGPT GPTs 微軟

ChatGPT擔任總指揮，控制所有AI模型！浙大&微軟亞研院HuggingGPT火了

網友：留口飯吃吧

豐色2023-04-03

ChatGPT

熱門文章

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

前端沒死，AI APP正在返祖

寧德時代給9萬+基層員工漲了薪！每月150元

云計算一哥10分鐘發了25個新品！Kimi和MiniMax首次上桌

精品播放一区二区| 国产精品国产三级国产普通话99| www.日本一区| 男人靠女人免费视频网站| 激情综合网五月天| 中文字幕国内精品| www.爱色av.com| 丁香婷婷综合色啪| 久久不射电影网| 97免费资源站| 少妇无码av无码专区在线观看| 久久久久久久久久久久久久久久久 | 少妇特黄一区二区三区| 成人免费a视频| 久久女同精品一区二区| 日韩黄色一级片| 日韩美女视频在线| 日韩av不卡播放| 亚洲黄网在线观看| 日韩一区视频在线| www.18av.com| 黄色工厂在线观看| 丰满熟妇乱又伦| 成人91在线观看| 色欧美片视频在线观看在线视频| 欧亚洲嫩模精品一区三区| 欧美激情久久久久| 日韩欧美视频在线免费观看| aaa国产一区| 国产成人精品免费视频网站| 亚洲精品乱码久久久久久按摩观| 伊人伊成久久人综合网小说| 麻豆精品免费视频| 欧美日韩国产丝袜另类| 99热99这里只有精品| 一本一道久久a久久精品逆3p | 99精品视频中文字幕| 亚洲福利视频网| 无码人妻aⅴ一区二区三区日本| 好吊妞视频一区二区三区| 波多野结衣视频网站| 91丨九色porny丨蝌蚪| 黑鬼大战白妞高潮喷白浆| 精品国产乱码一区二区三 | 91成人综合网| 久久亚洲综合| 成人信息集中地欧美| 91亚洲午夜精品久久久久久| 激情视频免费网站| 欧美放荡的少妇| 网站免费在线观看| 亚洲国产成人一区二区三区| 久久久久国产精品www| 法国空姐电影在线观看| 91在线视频免费91| 亚洲成人性视频| 91精品国产自产在线老师啪| 搡老岳熟女国产熟妇| 欧美高清一级片在线| 亚洲欧美自偷自拍另类| 久久嫩草精品久久久久| 欧美午夜精品久久久久久久| 成人av在线不卡| 麻豆一区二区99久久久久| 日韩亚洲欧美一区二区| 一本色道亚洲精品aⅴ| 欧美日韩午夜视频| 亚洲国产精品va在看黑人| 国产一二三在线视频| 成人激情av网| 欧美一区二区综合| 成人午夜碰碰视频| 日韩免费电影一区| 精品国产免费人成电影在线观... 精品国产免费久久久久久尖叫 | 国产精品一区二区三区四区五区| 激情av中文字幕| 亚洲精品成人电影| 欧美做受高潮电影o| 久99久精品视频免费观看| 黄www在线观看| 91大神在线播放精品| www国产亚洲精品久久麻豆| 国产三级精品在线不卡| 美女免费视频一区| 99re资源| 高清国产一区二区三区| 99re在线| 国产精品熟妇一区二区三区四区| 日韩欧美激情视频| 国产精品国产三级国产普通话99 | 免费观看污网站| 一区二区三区免费网站| 含羞草久久爱69一区| 亚洲国产经典视频| 亚洲视频在线观看一区二区三区| 欧美午夜一区二区三区| 欧美三级欧美一级| 亚洲黄色av女优在线观看| 91黄色小网站| 国产精品久久久久久久午夜片| 17婷婷久久www| 91黄色免费视频| 在线视频欧美精品| 亚洲啪av永久无码精品放毛片| 国产偷人爽久久久久久老妇app| 国产欧美日本一区二区三区| 色综合视频网站| 88av在线播放| 日韩在线观看免费高清| 人妻无码中文字幕免费视频蜜桃| 久久99久久99精品中文字幕| 久久精品国产99国产精品| 无码人妻丰满熟妇区五十路百度| 亚洲欧美在线一区| 中文字幕精品在线观看| 久久久久亚洲精品成人网小说| 欧美高清69hd| 91九色精品视频| 国产在线不卡一卡二卡三卡四卡| 在线看国产一区二区| 亚洲视频在线二区| 久久永久免费| 日av在线播放中文不卡| 国产免费观看久久| 欧美一区二区三区爽爽爽| 欧美浪妇xxxx高跟鞋交| 超碰中文字幕在线| 欧美一区二区三区精美影视| 亚洲一区欧美一区| 中文字幕乱妇无码av在线| 亚洲欧美日韩国产手机在线| 久久久久久成人网| 久久久亚洲天堂| 国产一区二区中文字幕| 亚洲区一区二区| 免费在线观看你懂的| 亚洲成人av电影| 日本中文字幕在线视频观看| 亚洲精品自产拍| 免费一区二区视频| 国产制服91一区二区三区制服| 国产亚洲欧洲高清一区| 亚洲男人的天堂网| 久久久久久久av麻豆果冻| 国产999精品久久久久久| 国产成人av免费| 欧美精品日韩在线| 97超级碰碰| 欧美日韩在线视频一区二区| 精品无码久久久久| 99精品一级欧美片免费播放| 亚洲天堂成人在线视频| 日韩人妻精品中文字幕| 成人在线免费网站| 亚洲天堂av网| 精品日韩中文字幕| 亚洲欧美久久234| 亚洲天堂男人的天堂| 亚洲国产无线乱码在线观看| 欧美高清视频一区| 久久精品视频在线观看| 日韩国产精品一区| 亚洲性夜色噜噜噜7777| 精品综合久久久久久97| 成人毛片在线免费观看| 一区二区三区在线观看免费视频| 国产精品一区二区三区免费观看| 黄色成人在线播放| 精品久久久久久久久久久久久久久久久久| 日韩免费在线观看av| 91精品在线免费| 日本少妇xxxx动漫| 久久99精品久久久久久秒播放器 | 国产精品男女猛烈高潮激情| www.天堂在线| 久久久久久久久免费看无码 | 国产大学生自拍| 国产一级黄色录像| 亚洲精品一二三四| 欧美主播一区二区三区美女久久精品人| 日韩欧美亚洲国产一区| 天堂在线观看视频| 男人的天堂官网| 欧美黑人经典片免费观看| 在线播放中文字幕一区| 一级做a爰片久久毛片16| 一级日韩一级欧美| 国产成人三级在线播放 | 91黑丝高跟在线| 91麻豆精品在线| 全黄一级裸体片| 欧美黄网站在线观看| 国产精品美乳一区二区免费| 宅男66日本亚洲欧美视频| 久久嫩草精品久久久久| 国产一级生活片| 亚洲一区二区精品在线观看| 最近2019好看的中文字幕免费| 久久一区视频| 亚欧视频在线观看| 久久综合久久88| 国产精品婷婷午夜在线观看| 日韩高清dvd碟片| 欧美一级片免费观看| 久久天天躁日日躁| 亚洲欧洲精品成人久久奇米网| 久久久久久自在自线| 少妇人妻大乳在线视频| 欧美激情视频一区二区| 国内成人精品一区| 国产精品美女久久| 日韩三级视频中文字幕| 亚洲一区二区三区在线播放| 亚洲国产成人porn| 一本久道久久综合无码中文| 亚洲av成人无码久久精品| 国产老熟女伦老熟妇露脸| 国产九九在线视频| 91福利免费观看| www日韩视频| 国模杨依粉嫩蝴蝶150p| 国产精品久久..4399| 国产丰满美女做爰| 精品蜜桃传媒| 欧美三级在线视频| 老司机一区二区| 日本中文字幕不卡| 成人午夜视频在线观看| 激情文学综合丁香| 国产一区999| 国产精品免费av| 欧美二区三区的天堂| 亚洲精品美女久久久| 国产精品国产三级国产aⅴ浪潮| 国产日韩欧美在线看| 成人欧美一区二区三区视频| 亚洲www视频| 91在线播放国产| 国产一区高清视频| 成年人网站大全| 日本一本二本在线观看| 久久久久久一区| 欧美高清性xxxxhd| 一本岛在线视频| 欧洲美女女同性互添| 日韩欧美不卡视频| 国精产品一品二品国精品69xx | 亚洲精品国产精品乱码在线观看| 久久人妻无码aⅴ毛片a片app| 日本不卡一二三区| 韩国一区二区在线播放| 国产chinesehd精品露脸| 亚洲国产精品三区| 人妻少妇一区二区| 国产成人精品一区二三区| 国产精品毛片一区二区在线看舒淇| 800av在线播放| 一边摸一边做爽的视频17国产 | 欧美最顶级丰满的aⅴ艳星| 欧美在线观看网址综合| 狠狠干一区二区| 奇米影视四色在线| 国语对白在线播放| 欧美中日韩在线| 2一3sex性hd| 人人干人人干人人干| 91在线小视频| 久久亚洲电影天堂| 香蕉视频1024| 国产麻豆精品久久一二三| 精品视频久久久久久久| 久久激情视频久久| 国产在线一区二区三区欧美| 日本美女视频一区| 一级黄色免费视频| 午夜影院免费在线观看| 天堂中文字幕av| 亚洲成人在线网站| 亚洲一区二区三区四区在线免费观看| 成人的网站免费观看| 亚洲女人****多毛耸耸8| 久久99精品国产99久久6尤物| 国产盗摄视频在线观看| 91制片厂毛片| 久久露脸国语精品国产91| 五月婷婷丁香花| 日韩欧美中文字幕在线播放| 欧美日韩激情小视频| 欧美专区在线观看| www.com久久久| 中文字幕第100页| 丰满少妇大力进入| 人妻内射一区二区在线视频| 日韩福利小视频| 日韩在线中文字幕视频| 色婷婷在线影院| 午夜三级在线观看| 免费中文字幕视频| 久久最新视频| 精品国偷自产在线| 欧美激情国内自拍| 成人动漫一区二区三区| 91精品国产一区| 特大黑人巨人吊xxxx| 国产精品毛片无遮挡高清| 国产伦精品一区二区三毛| 精品无码免费视频| 精品久久香蕉国产线看观看gif| 久久伦理网站| 国产麻豆91视频| 欧美日韩国产色站一区二区三区| 亚洲视频免费一区| 91精品久久久久久久久青青| 在线免费观看a级片| 日本伊人午夜精品| 亚洲国产精品久久久久秋霞蜜臀| 国产精品视频内| 男男受被啪到高潮自述| 一级成人黄色片| 欧美日韩中文一区| 欧美国产激情视频| 成人a免费在线看| 欧美精品一二区| 超碰男人的天堂| 一区二区激情小说| av在线播放天堂| 久久精品国产99| 在线日韩第一页| 亚洲精品激情视频| 亚洲综合在线五月| 精品免费视频123区| 媚黑女一区二区| 日韩中文理论片| 少妇高潮喷水在线观看| 欧美一区免费看| 夜夜精品浪潮av一区二区三区| 国产精品视频成人| 三级黄色在线观看| 国产无人区一区二区三区| 亚洲性生活视频| 91综合免费在线| 日韩在线观看免| 国产视频视频一区| 日韩小视频在线| 在线观看欧美激情| 99热这里只有精品1| 日韩欧美国产综合一区 | 国产在线精品播放| 放荡的美妇在线播放| 日韩欧美的一区| 成年人网站免费在线观看| 亚洲一区二区三区四区五区中文 | 欧美中文在线视频| 亚洲欧美激情网| 激情欧美一区二区三区在线观看| 色在人av网站天堂精品| 国产视频精品免费| 欧美一卡二卡三卡四卡| www.欧美黄色| 日韩精品福利网| 欧美日韩成人精品| 911国产在线| 欧美日韩三级一区二区| 亚洲一区二区三区四区五区xx| 99久久夜色精品国产网站| 久久在线视频在线| 在线观看国产精品一区| 亚洲精品日韩欧美| 漂亮人妻被中出中文字幕| 国产精品日产精品欧美精品| 91a在线视频| 国内偷拍精品视频| 精品免费视频.| 蜜臀视频一区二区三区| 99精品久久99久久久久| 亚洲不卡一卡2卡三卡4卡5卡精品| 成人午夜视频一区二区播放| 亚洲欧美日韩在线一区| 黄色永久免费网站| 国产女同性恋一区二区| 国产999精品久久久| 日韩网站在线播放| 一区二区在线观看av| 日本一区二区三区视频在线观看 | 成人免费在线小视频| 人妻一区二区三区免费| 亚洲国产三级网| 一级在线观看视频| 久久综合电影一区| 日韩久久久久久久久久| 日韩最新中文字幕电影免费看| 国产调教在线观看| 在线免费看av不卡| 精品深夜av无码一区二区老年| 久久夜精品香蕉| 中文字幕日韩三级| 97色在线播放视频| www日本高清视频| 国产精品免费久久久久影院| 亚洲中文一区二区三区| 成人性生交大片免费观看嘿嘿视频| 奇米影视7777精品一区二区| 国产精品久久久久久久7电影| 久久看片网站| 日本xxx免费| 六月丁香婷婷久久| 欧美精品在线极品| 亚洲色图27p| 久久精品国产成人精品| 丝瓜av网站精品一区二区|

<tbody id="z2yxo"><table id="z2yxo"><li id="z2yxo"></li></table></tbody>

<tbody id="z2yxo"></tbody>

<dd id="z2yxo"><tfoot id="z2yxo"><abbr id="z2yxo"></abbr></tfoot></dd>