色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

無需注冊or排隊

明敏 發自 凹非寺

量子位 | 公眾號 QbitAI

這邊ChatGPT、GPT-4等AI大模型和應用打得火熱;

另一邊“平替”開源復現方案也加緊更新迭代。

這不,“首個開源ChatGPT低成本復現流程”就來了波大更新!

現在,僅需不到百億參數,利用RLHF簡單微調,模型即可掌握中、英雙語能力,達到與ChatGPT和GPT-3.5相當的效果。

中文對話效果如下:

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

這就是ColossalChat

由Colossal-AI推出。一個月前,Colossal-AI乘著ChatGPT熱潮火速開源了低成本復現流程。

而新升級的ColossalChat,以Meta最新開源的LLaMA為基礎預訓練模型,能力更強、門檻還更低了:

  • Demo:可直接在線體驗模型效果,無需注冊或waitinglist
  • 訓練代碼:開源完整 RLHF 訓練代碼,已開源至含7B、13B兩種模型
  • 數據集:開源104K中、英雙語數據集
  • 推理部署:4bit量化推理70億參數模型僅需4GB顯存
  • 模型權重:僅需單臺服務器少量算力即可快速復現
  • 更大規模模型、數據集、其他優化等將保持高速迭代添加

要知道,模型開源、數據集、訓練應用成本、核心數據安全性等,是AI大模型浪潮下最被關注的一些問題。ColossalChat針對于此,一次性給出了應對方法。

由此,想要快速跟進ChatGPT這輪技術浪潮,門檻又低了一些。

開源地址:https://github.com/hpcaitech/ColossalAI

包含完整 RLHF 流程

具體來看,ColossalChat的能力包括知識問答、中英文對話、內容創作、編程等。

和ChatGPT一樣,ColossalChat知道NBA和喬丹是誰:

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

會寫郵件,格式非常規范:

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

編程能力也不錯,能搞定算法:

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

據了解,為了能更逼近ChatGPT、GPT-4的驚艷效果,ColossalChat使用LLaMA作為預訓練模型,并包含完整RLHF流程。

之所以這樣做,主要是因為現有開源方案都可被視為只得到了人類反饋強化學習(RLHF)中第一步的監督微調模型,沒有進行后續的對齊和微調工作。

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

△RLHF的三個階段

比如Meta 開源了LLaMA模型,其參數量從70億到650億不等,號稱130 億參數即可勝過1750億的GPT-3模型在大多數基準測試的表現。

但是由于沒有被指令微調(instruct tuning),因此實際生成效果不夠理想。

斯坦福的Alpaca通過調用OpenAI API,以self-instruct方式生成訓練數據,使得僅有70億參數的輕量級模型以極低成本微調后,即可獲得媲美GPT-3.5這樣千億參數的超大規模語言模型的對話效果。

而ChatGPT、GPT-4效果好的一大關鍵就是將RLHF引入訓練流程,才能讓生成內容更符合人類價值觀。

因此,基于LLaMA模型,包含完整RLHF流程的類Chat模型復現方案 ColossalChat,可以稱得上是目前最接近ChatGPT原始技術路線的實用開源項目。

總結來看,和Alpaca相比較ColossalChat具備4個方面的優勢

第一、ColossalChat開源了第一個完整的RLHF pipeline,斯坦福Alpaca沒有做RLHF,也就是沒有做Stage2和3。

第二、ColossalChat采用了更多的指令數據,質量更好、范圍更大,并使用強化學習做了alignment使回答更接近人類。

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

第三、ColossalChat訓練流程集成了Colossal-AI的諸多系統優化,同等數據集和模型大小的訓練速度可以比AIpaca快3倍左右能讓科研人員和中小企業獨立訓練部署自己的會話系統

第四、ColossalChat采集了更多數據集:訓練的英文一共 24M tokens,中文大約 30M tokens,總共約 54M tokens。其中ColossalChat自己收集的數據集英文 6M,中文 18M tokens。

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

訓練數據集開源

數據集方面,ColossalChat開源了包含約10 萬條問答的中、英雙語數據集

該數據集收集并清洗了社交平臺上人們的真實提問場景作為種子數據集,利用self-instruct技術擴充數據,花費約900美元進行標注。

對比其他self-instruct方法生成的數據集,該數據集的種子數據更加真實、豐富,生成的數據集涵蓋的話題更多。

該數據可以同時用于微調和RLHF訓練。通過高質量的數據,ColossalChat能進行更好地對話交互,同時支持中文。

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

△ColossalChat數據集收集流程

RLHF算法復現

RLHF第一步(Stage1)是supervised-fintuning,即使用上文提到的數據集進行模型微調。

RLHF第二步(Stage2)訓練了獎勵模型,它通過對于同一個prompt的不同輸出進行人工排序,得到對應分數,監督訓練獎勵模型。

RLHF第三步(Stage3)使用了強化學習算法,是訓練流程中最復雜的一部分:

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

△RLHF-Stage3算法流程圖

在PPO部分,ColossalChat分為兩個階段進行:

首先是Make Experience部分,利用SFT、Actor、RM、Critic模型計算生成Experience存入buffer中;之后是參數更新部分,利用Experience計算策略損失和價值損失。

在PTX部分,ColossalChat計算Actor輸出response和輸入語料的回答部分的交叉熵損失函數,用來在PPO梯度中加入預訓練梯度,以保持語言模型原有性能防止遺忘。最后將策略損失、價值損失和 PTX 損失加和進行反向傳播和參數更新。

快速上手

ColossalChat開源了基于 LLaMA 模型,復現訓練 ChatGPT 三個階段的完整代碼。

第一階段,訓練SFT模型:

# Training with a 4-GPU servers
colossalai run –nproc_per_node=4 train_sft.py
–pretrain “/path/to/LLaMa-7B/”
–model ‘llama’
–strategy colossalai_zero2
–log_interval 10
–save_path /path/to/Coati-7B
–dataset /path/to/data.json
–batch_size 4
–accimulation_steps 8
–lr 2e-5

第二階段,訓練獎勵模型:

# Training with a 4-GPU servers
colossalai run –nproc_per_node=4 train_reward_model.py
–pretrain “/path/to/LLaMa-7B/”
–model ‘llama’
–strategy colossalai_zero2
–dataset /path/to/datasets

第三階段,使用RL訓練:

# Training with a 8-GPU servers
colossalai run –nproc_per_node=8 train_prompts.py prompts.csv
–strategy colossalai_zero2
–pretrain “/path/to/Coati-7B”
–model ‘llama’
–pretrain_dataset /path/to/dataset

在獲得最終模型權重后,還可通過量化降低推理硬件成本,并啟動在線推理服務,僅需單張約4GB顯存的GPU即可完成70億參數模型推理服務部署

python server.py /path/to/pretrained –quant 4bit –gptq_checkpoint /path/to/coati-7b-4bit-128g.pt –gptq_group_size 128

系統性能優化與開發加速

ColossalChat能夠快速跟進ChatGPT完整RLHF流程復現,離不開AI大模型基礎設施Colossal-AI及相關優化技術的底座支持,相同條件下訓練速度相比Alpaca采用的FSDP(Fully Sharded Data Parallel) 可提升3倍以上

系統基礎設施Colossal-AI

AI大模型開發系統Colossal-AI為該方案提供了基礎支持,它可基于PyTorch高效快速部署AI大模型訓練和推理,從而降低AI大模型應用的成本。

Colossal-AI由加州伯克利大學杰出教授James Demmel和新加坡國立大學校長青年教授尤洋領導開發。

自從它開源以來,Colossal-AI已經多次在GitHub熱榜位列世界第一,獲得GitHub Star約兩萬顆,并成功入選SC、AAAI、PPoPP、CVPR、ISC等國際AI與HPC頂級會議的官方教程。

減少內存冗余的ZeRO+Gemini

Colossal-AI支持使用無冗余優化器 (ZeRO) 提高內存使用效率,低成本容納更大模型,同時不影響計算粒度和通信效率。

自動Chunk機制可以進一步提升ZeRO的性能,提高內存使用效率,減少通信次數并避免內存碎片。

異構內存空間管理器Gemini支持將優化器狀態從GPU顯存卸載到CPU內存或硬盤空間,以突破GPU顯存容量限制,擴展可訓練模型的規模,降低AI大模型應用成本。

使用LoRA低成本微調

Colossal-AI支持使用低秩矩陣微調(LoRA)方法,對AI大模型進行低成本微調。

LoRA方法認為大語言模型是過參數化的,而在微調時,參數改變量是一個低秩矩陣。

因此,可以將這個矩陣分解為兩個更小的矩陣的乘積。

在微調過程中,大模型的參數被固定,只有低秩矩陣參數被調整,從而顯著減小了訓練所需的參數量,并降低成本。

低成本量化推理

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

△GPTQ量化

為降低推理部署成本,Colossal-AI使用GPTQ 4bit量化推理。

在GPT/OPT/BLOOM類模型上,它比傳統的RTN(rount-to-nearest) 量化技術能夠獲得更好的Perplexity效果。相比常見的FP16推理,它可將顯存消耗降低75%,只損失極少量的吞吐速度與Perplexity性能。

以ColossalChat-7B為例,在使用4bit量化推理時,70億參數模型僅需大約4GB顯存即可完成短序列(生成長度為128)推理,在普通消費級顯卡上即可完成(例如RTX 3060 Laptop),僅需一行代碼即可使用。

if args.quant == ‘4bit’:
model = load_quant(args.pretrained, args.gptq_checkpoint, 4, args.gptq_group_size)

如果采用高效的異步卸載技術(offload),還可以進一步降低顯存要求,使用更低成本的硬件推理更大的模型。

開放協作

不過目前由于算力和數據集有限,在部分場景下的實際性能還有提升空間。

比如還是會被弱智吧問題難住:

零門檻復現ChatGPT:預訓練模型數據集直接用,包含完整RLHF流程,在線可體驗

而在這輪技術浪潮中,除了科技巨頭們,PyTorch、Hugging Face和OpenAI等開源社區與初創企業也起到了關鍵作用。

借鑒這些成功經驗,Colossal-AI也歡迎各方參與共建,并給出了多種參與方式:

  • 在GitHub發布issue或提交pull request (PR)
  • 加入Colossal-AI用戶微信或Slack群交流
  • 發送正式合作提案到郵箱youy@comp.nus.edu.sg

如果你對這項工作感興趣,可以趕快和他們取得聯系~

開源地址:
https://github.com/hpcaitech/ColossalAI

參考鏈接:

https://medium.com/@yangyou_berkeley/colossalchat-an-open-source-solution-for-cloning-chatgpt-with-a-complete-rlhf-pipeline-5edf08fb538b

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
精品久久久网站| 蜜臀精品一区二区三区在线观看| 隣の若妻さん波多野结衣| 九九**精品视频免费播放| 久久久久久久综合| 欧美日韩国产中文| 欧美成人高清视频| 激情伦成人综合小说| 国产中文字幕免费观看| 中文字幕有码在线播放| 亚洲午夜激情视频| 成人爱爱电影网址| 亚洲品质自拍视频网站| 欧美午夜电影网| 国产亚洲精品美女久久久| 国模吧一区二区| 亚洲视频小说| 久久久精品人妻无码专区| 国产一级片一区二区| 丁香婷婷综合网| 日韩一区二区三区av| 国产成人精品在线播放| 北条麻妃在线视频观看| 久久午夜无码鲁丝片| 国产高清久久久久| 欧美r级在线观看| 91精品国产高清久久久久久91裸体 | 国产女片a归国片aa| 激情综合五月天| 欧美二区乱c少妇| 国产日产亚洲精品| 91网址在线观看精品| 伊人22222| 亚洲另类在线一区| 91国内精品久久| 国产精品免费入口| 一区二区视频网| 亚洲精品五月天| 欧美黑人xxxⅹ高潮交| 欧美一级黄色录像片| 天天干中文字幕| 91麻豆6部合集magnet| 亚洲欧美成人精品| 伊人av成人| 精品爆乳一区二区三区无码av| 成人国产精品视频| 自拍亚洲一区欧美另类| 强开小嫩苞一区二区三区网站 | 91精品婷婷国产综合久久| 成人黄色免费网站在线观看| 伊人成人免费视频| 日日夜夜精品视频天天综合网| 欧美揉bbbbb揉bbbbb| 国产一区二区三区免费不卡| 男人操女人动态图| 成人av资源站| 欧美巨大黑人极品精男| 999精品网站| 蜜桃视频在线观看www| 欧美日韩黄色影视| 欧美高清性xxxxhdvideosex| 五月天激情丁香| 国产精品欧美精品| 欧美综合第一页| 永久免费未满蜜桃| 成人综合在线视频| 欧美成人在线网站| 欧美xxxxxbbbbb| 国产一区二区美女| 九九热在线精品视频| 亚洲36d大奶网| 日韩中文字幕区一区有砖一区| 亚洲成人激情图| 国产精品久久久久7777| 99热这里只有精品66| 欧美日韩大陆在线| 小说区视频区图片区| 国产日韩久久久| 欧美日韩www| 国产手机视频在线观看| 99久久精品国产一区色| 日韩美女视频在线| 日本高清视频免费在线观看| 国产视频一区二区三| 日韩免费在线观看| 阿v天堂2017| 青青青伊人色综合久久| 色一区av在线| 午夜福利三级理论电影| 2020国产成人综合网| 国产精品国产自产拍高清av水多 | 日韩三级在线免费观看| 丁香六月激情网| 日韩精品1区2区3区| 久久精品一偷一偷国产| 性农村xxxxx小树林| 国产亚洲午夜高清国产拍精品| 国产精品久久久一区| 青娱乐av在线| 欧美色中文字幕| 免费在线看黄色片| 精品在线你懂的| 91精品国产高清自在线| 天堂а√在线中文在线鲁大师| 一区二区三区在线观看欧美| 欧美日韩成人一区二区三区| 中日韩在线观看视频| 亚洲国产精品美女| 国产999免费视频| 日本一区二区三区四区在线视频| 99久久一区三区四区免费| 免费的毛片视频| 日韩精品福利在线| 欧美xxxx×黑人性爽| 一区二区三区影院| 亚洲国产精品一区在线观看不卡| 亚洲黄色在线播放| 欧美激情免费观看| 欧美日韩在线国产| 精品日韩在线一区| 久久精品aⅴ无码中文字字幕重口| 久久久精品天堂| 欧美一二三区| 免费欧美在线视频| 国产精品美女久久久久av超清| 免费观看一区二区三区毛片 | 国产无套精品一区二区三区| ...中文天堂在线一区| 日韩一本精品| 美国一区二区三区在线播放 | 精品少妇人妻av免费久久洗澡| 国产中文一区二区三区| 97人人澡人人爽| 丰满人妻av一区二区三区| 欧美激情一级精品国产| 800av免费在线观看| 一区二区三区四区在线观看视频| 中国特黄一级片| 欧美电视剧在线看免费| 中国xxxx性xxxx产国| 欧洲视频一区二区| xxxxwww一片| 91高清视频免费看| 亚洲图片欧美另类| 欧美日韩国产大片| 国产草草浮力影院| 日韩无一区二区| 老牛影视av老牛影视av| 精品欧美乱码久久久久久1区2区| 国产精品无码网站| 日韩女优电影在线观看| 欧美狂猛xxxxx乱大交3| 日韩美女一区二区三区| 日本欧美一区二区三区不卡视频| 欧美精选午夜久久久乱码6080| 亚洲一区二区三区综合| 欧美一区二区精品在线| 真实乱视频国产免费观看| 精品久久久久久久久久久院品网| 制服 丝袜 综合 日韩 欧美| 日韩欧美一区二区久久婷婷| 久久久久久久久福利| 亚洲免费人成在线视频观看| 中文字幕亚洲欧美日韩| 色噜噜狠狠色综合网图区| 九九热在线免费观看| 国模精品视频一区二区| 性做久久久久久久| 亚洲伊人久久大香线蕉av| 精品一区二区影视| 超碰10000| 一区二区在线观看视频在线观看| 五月天视频在线观看| 91精品国模一区二区三区| 亚洲少妇xxx| 中文字幕在线成人| 91在线视频国产| 亚洲精品日韩av| 成人小视频在线观看| 成年人看的毛片| 欧美日韩综合视频| 黄色激情小视频| 欧美日韩成人在线视频| 欧美一级特黄aaaaaa| 久99久在线| 1024成人网色www| 999精品视频在线| 日韩三级.com| 免费看日批视频| 成人欧美一区二区三区黑人| 丁香婷婷深情五月亚洲| 91国视频在线| 91精品国产综合久久蜜臀| 欧美成人国产精品高潮| 国产91网红主播在线观看| 国产一区二区三区不卡在线观看| 亚洲乱码日产精品bd在线观看| 欧美日韩在线第一页| 九九这里只有精品视频| 热99在线视频| 成人午夜在线免费| 奇米影视四色在线| 亚洲精品视频播放| 国内精品偷拍视频| 亚洲区一区二区三区| 五月天亚洲精品| 久久国产波多野结衣| 国产精品日日做人人爱| 久久九九全国免费| 999精品免费视频| 欧美精品激情blacked18| 精品一区二区三区欧美| 小泽玛利亚视频在线观看| 亚洲欧美成人精品| 日日夜夜免费精品| 国产一区二区在线视频播放| 日韩精品一区在线| 99久久婷婷国产一区二区三区| 日韩精品久久久| 欧美亚洲综合久久| 久久精品视频国产| 久久国产精品99久久久久久丝袜| 亚洲一区二区三区影院| 黄色一级视频在线观看| 国产精品一区二区欧美黑人喷潮水| 亚洲三级在线看| 免费视频一二三区| 裸模一区二区三区免费| 91久久精品一区二区三| 国产黄色免费视频| 中国女人做爰视频| 日韩av最新在线| 老司机精品视频在线| 日韩精品视频网址| 91精品国产91久久久久久最新| 91亚洲精华国产精华精华液| 90岁老太婆乱淫| 亚洲一区二区三| 欧美性videos高清精品| 一区二区的视频| 天天摸天天碰天天添| 久久久99免费视频| 久久免费精品国产久精品久久久久| 成人片黄网站色大片免费毛片| 国产日韩综合一区二区性色av| 亚洲图片自拍偷拍| www.久久视频| 国产亚洲综合视频| 欧美激情久久久| 亚洲天堂网中文字| 四虎精品永久在线| av一区二区三区免费观看| 亚洲天堂日韩电影| 久久先锋影音av| 国产无码精品视频| 亚洲国产一二三精品无码| 在线日韩精品视频| 国产欧美一区二区精品性色| 九九视频在线免费观看| 一本久道久久综合| 国产亚洲欧美一区| 97se亚洲国产综合自在线| 我要看黄色一级片| 影音先锋欧美资源| 亚洲视频第一页| 久久久久久久免费视频了| 国产第一页在线播放| 免费的一级黄色片| 久久人人爽人人爽人人片av高请| 亚洲欧美日韩成人高清在线一区| 成人小视频在线播放| 欧美 国产 日本| 国产成人鲁鲁免费视频a| 一本久久a久久精品亚洲| 五月天激情开心网| 无码人妻aⅴ一区二区三区| 国产精品久久久久久久免费大片| 精品剧情v国产在线观看在线| 国产精品66部| 日本五十熟hd丰满| 中文字幕无码不卡免费视频| 国产成人综合精品| 欧美一区二区三区不卡| 懂色中文一区二区在线播放| 国产一级免费av| 国产一区二区三区精彩视频| 国产精品高清网站| 日韩一区二区免费高清| 99热这里都是精品| 日韩xxx视频| 三大队在线观看| 日本免费高清不卡| 久久久久久久久久久免费| 色网站国产精品| 国产剧情在线观看一区二区| 日韩在线视频免费播放| 日本中文字幕二区| 欧美h视频在线| 久久久久久久久电影| 欧美福利视频一区| 日本一区二区三区视频视频| 国产成人精品免费看视频| 国产亚洲色婷婷久久99精品91| 亚洲欧美成人一区| 国产精品1区2区在线观看| 欧美白人最猛性xxxxx69交| 中文一区在线播放| 久久久久久夜| 日韩欧美性视频| 中文字幕人妻无码系列第三区| 欧美日韩精品免费观看视一区二区 | 韩国三级在线看| 一区不卡字幕| 成人亚洲激情网| www.亚洲免费视频| 欧美剧情电影在线观看完整版免费励志电影| 成人在线视频首页| 国产高清不卡视频| 一区二区视频免费看| 国产永久免费网站| 亚洲资源在线网| 青青在线视频一区二区三区| 亚洲福利在线观看| 欧美日韩激情网| 99国产精品久| 久久亚洲欧美| 人妻丰满熟妇av无码区| 高潮毛片无遮挡| 精品久久久噜噜噜噜久久图片| 欧美日韩在线观看一区| 国产成人亚洲综合91精品| 亚洲视频欧洲视频| 欧美人妖巨大在线| 一区二区三区在线观看国产 | 久久精品一区| 探花国产精品一区二区| 香蕉成人在线视频| 无码成人精品区在线观看| 欧美韩国日本在线| 一区二区三区视频| 国产一区自拍视频| 成人精品福利视频| 欧美亚洲日本黄色| xvideos亚洲人网站| 欧美精品一区在线观看| 色天使久久综合网天天| 国产精品国产成人国产三级 | 日韩成人av影视| 国产高潮流白浆喷水视频| 欧美日韩综合在线观看| 国产亚洲精品久久久久久豆腐| 美女扒开腿免费视频| 国产av人人夜夜澡人人爽| 麻豆传媒网站在线观看| 午夜精品亚洲一区二区三区嫩草 | 日日夜夜精品网站| 国产私拍一区| 成人av网站观看| 成人妇女免费播放久久久| 欧美中文在线观看国产| 久久久久国产精品一区| 久久精品国产91精品亚洲| 一本色道久久综合狠狠躁篇怎么玩 | 亚洲午夜影视影院在线观看| 国产精品欧美极品| 久久久精品日韩欧美| 久久日韩精品一区二区五区| 成人性生交大片| 福利视频网站一区二区三区| 国产精品亚洲成人| 国产99久久久国产精品免费看| 国产一区二区三区四区五区入口| 天使萌一区二区三区免费观看| www.桃色av嫩草.com| 丰满人妻一区二区三区四区53| 亚洲精品无码专区| 特黄aaaaaaaaa真人毛片| 国模人体一区二区| 天堂8在线视频| 久久精品123| 久色婷婷小香蕉久久| 精品一区二区久久| 国产91丝袜在线播放0| 99热在这里有精品免费| 国产丝袜欧美中文另类| 国产精品久久久久久久久久久免费看 | 精品一区二区三区无码视频| 日本欧美黄色片| 久久久久久香蕉| 久久久久无码精品| 精品人妻一区二区三区日产乱码卜| 免费黄色在线视频| 国产麻豆视频在线观看| 国产精品1000| 亚洲无码久久久久久久| 日日夜夜精品免费| 久久草av在线| 91丨porny丨最新| 18成人在线观看| 日韩欧美成人免费视频| 91精品国产日韩91久久久久久| 精品久久久久久久久久久院品网| 一本一道久久a久久精品逆3p| 美日韩丰满少妇在线观看| 欧美与黑人午夜性猛交久久久| 国产玖玖精品视频| 免费毛片一区二区三区久久久| 国产日韩视频在线播放| 中文久久久久久| 级毛片内射视频|