英偉達發(fā)布ChatGPT專用GPU,性能提升10倍,還推出云服務(wù),普通企業(yè)也能訓練LLM
還推出新AI加速技術(shù),光刻計算速度提升40倍
Pine 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
“AI的iPhone時刻已至”,英偉達或成最大贏家。
在GTC2023大會上,黃仁勛接連放出大招:
不僅發(fā)布了ChatGPT專用GPU,比之前就能實時處理ChatGPT的HGX A100快了10倍;
還公布了其在芯片領(lǐng)域的進展,推出了新的cuLitho軟件庫,使光刻計算速度整體提高了40倍。

從老黃的言語中也能得知,當下各種爆紅的AIGC產(chǎn)品:ChatGPT、Stable Diffusion、DALL-E等都能見到英偉達的身影。
而去年年末至今,ChatGPT爆火,也順勢拉動了英偉達的股價,年初至今就上漲83%。
目前,英偉達的市值為6471億美元。

會上及會后采訪中,老黃的言語之中也是透露著對AI生成內(nèi)容的褒獎:
AI是用人類語言編程的新型計算機,未來每個人都將是程序員。
話不多說,會上具體都有哪些亮點,一起盤點下~
發(fā)布ChatGPT專用GPU
會前,網(wǎng)友們對GTC的猜測都集中在ChatGPT上。
而英偉達,也是毫不吝嗇,不止ChatGPT,AIGC方面直接一把推出了四種針對AI任務(wù)的推理平臺:
- L4 Tensor Core GPU
- L40 GPU
- H100 NVL GPU
- Grace Hopper超級芯片

其中,H100 NVL GPU是英偉達這次推出的ChatGPT的專用GPU,它是基于去年已經(jīng)發(fā)布的H100的改進版本:配備雙GPU NVLink,將兩張擁有94GB HBM3顯存的PCIe H100 GPU拼接在一起。
性能的話,老黃形象地做了個對比:
相較于目前唯一可以實時處理ChatGPT的HGX A100,一臺搭載四對H100和雙NVLINK的標準服務(wù)器能將速度提升10倍,并且還可以將大語言模型的處理成本降低一個數(shù)量級。
期間,老黃還展示了自己親自把首款簽名版DGX交付給OpenAI的畫面。

然后再來說下其他三個推理平臺:
L4是專門針對AI生成視頻設(shè)計的一款通用GPU,它提供的視頻性能比CPU高出整整120倍,能效提高了99%。
L40則是用在圖像生成上的GPU,它能對AI生成2D、3D圖像進行優(yōu)化,相較于英偉達的云推理GPU T4,性能提升了10倍。
Grace Hopper超級芯片用在推薦系統(tǒng)和大型語言模型AI數(shù)據(jù)庫上,圖推薦模型、向量數(shù)據(jù)庫和圖神經(jīng)網(wǎng)絡(luò)都可以選擇這款芯片。
更具體一點,通過900GB/s高速芯片對芯片的接口,Grace Hopper超級芯片可連接Grace GPU和Hopper GPU,而Grace和Hopper正是處理大型語言數(shù)據(jù)集的理想選擇。
到這里,你以為關(guān)于ChatGPT的相關(guān)產(chǎn)品就沒了?
大NO特NO。
在ChatGPT這塊兒,英偉達還致力于下沉市場,聯(lián)合微軟Azure、Google GCP和Oracle OCI三家云廠商合作推出了DGX Cloud。
普通企業(yè)也能訓練LLM。
也就是說,想要訓練像ChatGPT的大語言模型,可以直接在網(wǎng)絡(luò)上租賃DGX云服務(wù),這樣一來客戶就能將英偉達DGX AI超級計算機實時接入公司。
英偉達提供的DGX服務(wù)器,包含8個H100或A100圖形處理器和640GB內(nèi)存,A100層的價格為每月36999美元。
而直接購買一個實體DGX服務(wù)器,就要花費20萬美元,并且微軟當時為了訓練新必應(yīng)也是斥資數(shù)億美元購買了數(shù)萬塊A100芯片。
用cuLitho加速芯片創(chuàng)新
ChatGPT等一眾AIGC產(chǎn)品毫無疑問已經(jīng)成為當前的AI圈的寵兒,不過在英偉達眼中ChatGPT只是一個起點。
GTC大會上,老黃放出了另一枚重磅級“核彈”,把加速計算引入到光刻領(lǐng)域——推出英偉達cuLitho計算光刻庫。

cuLitho計算光刻庫是啥?
一言以蔽之,cuLitho是一個可以加速光刻基礎(chǔ)計算的算法庫,能夠很大程度上提升光刻計算的速度,并且節(jié)省能耗。
老黃表示,目前計算光刻每年都需要消耗數(shù)百億CPU時間。而運行在GPU上cuLitho,可以將目前光刻技術(shù)的性能提升40倍,功耗降低至此前的1/9。
甚至在某種程度上cuLitho還可以為行業(yè)2nm工藝奠定基礎(chǔ)。
目前,英偉達已經(jīng)與臺積電、ASML和Synopsys等芯片廠商達成合作,后續(xù)芯片生產(chǎn)中,也會引入cuLitho這項AI技術(shù)。
其中,臺積電CEO魏哲家稱贊,cuLitho為臺積電在芯片制造領(lǐng)域部署反向光刻技術(shù)和深度學習等光刻解決方案開辟了新的可能性。
老黃也在會上預告,臺積電將在今年6月份的2nm芯片生產(chǎn)中引入cuLitho。
ASML首席執(zhí)行官Peter Wennink也做出計劃,讓所有的計算光刻軟件產(chǎn)品都支持GPU,同時也表示與英偉達在GPU和cuLitho上的合作會給計算光刻帶來巨大的好處。
Synopsys公司這邊,在cuLitho平臺上運行了Synopsys OPC軟件,性能直接得到了從幾周到幾天的提升。
一些其他亮點
除了上面提到的這些,GTC大會上,英偉達還公布了一些其他合作項目:
比如說生成式AI方面有Adobe、Getty Images和Shutterstock。
醫(yī)學方面,英偉達宣布了新的合作伙伴和Medtronic合作,黃仁勛透露,目前正在一起為構(gòu)建一個醫(yī)療方面的AI平臺,涵蓋手術(shù)引導和機器人輔助手術(shù)。

……
如果還想了解更多關(guān)于GTC2023的內(nèi)容,可以戳下面鏈接查看直播回放。
直播回放:
https://www.youtube.com/watch?v=DiGB5uAYKAg
參考鏈接
[1]https://www.theverge.com/23649329/nvidia-dgx-cloud-microsoft-google-oracle-chatgpt-web-browser
[2]https://nvidianews.nvidia.com/news/nvidia-asml-tsmc-and-synopsys-set-foundation-for-next-generation-chip-manufacturing




