英偉達CV公開課第2期:利用TensorRT部署遷移式學(xué)習(xí)工具包構(gòu)建的引擎
主講人 | 何琨 英偉達
量子位編輯 | 公眾號 QbitAI
3月12日,英偉達圖像處理系列公開課第二期線上開播,跟數(shù)百位開發(fā)者同學(xué)共同探討了如何利用TensorRT部署遷移式學(xué)習(xí)工具包構(gòu)建的引擎。
應(yīng)讀者要求,將分享內(nèi)容整理出來,與大家分享。直播中主要的live coding環(huán)節(jié),還請大家觀看文末的直播回放鏈接~
我每次分享都會給大家展示這張圖。
它很好的詮釋了深度學(xué)習(xí)的框架,從應(yīng)用角度來說,視覺、語音識別、NLP、情感與推薦系統(tǒng)等是目前發(fā)展較快的領(lǐng)域。市面上有很多框架支持這些深度學(xué)習(xí)的應(yīng)用,如Caffe、TensorFlow、PyTorch等,而支撐起這些框架的基礎(chǔ)是強大的計算能力。
NVIDIA提供了大量的GPU、邊緣設(shè)備等,為深度學(xué)習(xí)框架、推理訓(xùn)練提供了強大的支撐能力。在英偉達CUDA生態(tài)系統(tǒng)上,建立了cuDNN、TensorRT、DeepStream SDK、cuBLAS等一系列工具,都是中層的框架應(yīng)用的基礎(chǔ)的內(nèi)容。
今天要介紹的兩個工具是TensorRT和遷移式學(xué)習(xí)工具包(Transfer Learning Toolkit,簡稱TLT)。
遷移式學(xué)習(xí)工具包
TLT是一個基于Python的工具包,它提供了大量預(yù)先訓(xùn)練的模型,并提供一系列的工具,使流行的網(wǎng)絡(luò)架構(gòu)適應(yīng)開發(fā)者自己的數(shù)據(jù),并且能夠訓(xùn)練、調(diào)整、修剪和導(dǎo)出模型,以進行部署。
相當于站在巨人的肩膀,大大提高深度學(xué)習(xí)工作流的效率和精度。
在TLT之后還有兩個工具,一個是DeepStream,一個是TensorRT。TensorRT是DeepStream的一部分。
DeepStream是為AI視覺領(lǐng)域的應(yīng)用和解決方案而設(shè)計的。涵蓋了視頻處理部署階段的所有模塊,它提供了完整的框架和所有基本構(gòu)建模塊。可以讓開發(fā)者專注于自己的核心深度學(xué)習(xí)網(wǎng)絡(luò)和IP,而不是從頭開始設(shè)計端到端解決方案。
其中的Gstreamer可幫助大家處理視頻中的編解碼,TensorRT可處理數(shù)據(jù)推理等過程。
TLT、TensorRT、DeepStream這三個工具的應(yīng)用,在計算機視覺領(lǐng)域形成一個完整的流水線,幫助大家處理從訓(xùn)練、推理、部署,到產(chǎn)品端的一系列工作。
TLT提供了很多訓(xùn)練好的模型,(上圖)列舉了30多種常用預(yù)訓(xùn)練模型,大家可以在NGC(https://www.nvidia.cn/gpu-cloud/)上下載。
然后通過TLT對其進行訓(xùn)練、剪枝、再訓(xùn)練等。輸出后的模型可以直接進行部署,也可以部署在移動端或嵌入式產(chǎn)品上,比如自動駕駛汽車、無人機上。
TensorRT
TensorRT的本質(zhì)是GPU推理引擎,是英偉達GPU深度學(xué)習(xí)模型推理加速的工具。目前已經(jīng)發(fā)展到第7個版本,支持超過20個新的ONNX操作,適用性很廣。
TensorRT的工作模式是,先輸入訓(xùn)練好的模型和網(wǎng)絡(luò)結(jié)構(gòu),TensorRT會優(yōu)化網(wǎng)絡(luò)計算模式,生成一個中間文件(代碼環(huán)節(jié)中將詳細展示),直接生成可執(zhí)行引擎,從而實現(xiàn)加速。
大家如果對TensorRT的原理、邏輯感興趣,可以在優(yōu)酷上搜索更多視頻(英偉達頻道鏈接:https://acz.youku.com/wow/ykpage/act/miniappshare?uid=UMTA3MjYwNA==&sharekey=851467b71094c1d6c612d7bcaef255455)。
接下來何琨老師詳解了TensorRT的實際操作。受限于文字描述,我們將操作流程、代碼、PPT等上傳至網(wǎng)盤,正在學(xué)習(xí)的小伙伴可以直接下載查看:
提取鏈接: https://pan.baidu.com/s/1HJYTwIMIOBcuvRl1wKHOTA,提取碼: p7wx
本期課程直播回放:https://info.nvidia.com/291730-ondemand.html
第一期課程直播回放:https://info.nvidia.com/272903-ondemand.html
—完—




