15個產業級算法推出、35個高精度預訓練模型上線！最強國產開源AI框架再進化，密集提升視覺產業實戰能力

乾明 2020-03-23 12:46:58 來源：量子位

乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

2項全新能力，4大重磅升級，35個高精度預訓練模型上線，15個產業實踐中廣泛應用的視覺算法加持……

這就是最強國產開源深度學習框架——飛槳的最新重要升級。

在近日飛槳官宣的一系列新模型、新能力中：

不僅有對主流模型的能力提升，比如大幅增強YOLOv3——訓練提速40%，推理提速21%，精度提升4.3%；
還納入最新的SOTA模型，比如基于COCO數據集的精度最高開源模型CBNet；
并上線了用于3D點云分類、分割和檢測的PointNet++和PointRCNN模型，使其成為國內首家支持3D圖像深度學習的開源平臺；
相應地，這些模型的開發、壓縮、部署的“一條龍服務”也升級到全新版本，比如目標檢測模型，使用蒸餾+裁剪模型壓縮方案，基于COCO數據集進行測試，可以加速2.3倍。

更關鍵的是，像這樣的全新發布與重大升級，飛槳一口氣放出了6項，涉及15種算法和35個預訓練模型，全部聚焦于視覺能力。毫不夸張地說，經此升級，飛槳在視覺領域的能力又出現一次大跨越。

而此時，距離飛槳上一次大升級只過了4個月左右。

如此密集的迭代升級為哪般？

結合之前工業化大生產、智能化產業升級，以及新基建蓄力，不難看出飛槳所指，不止于前沿技術突破，更在于產業應用和落地。

而且看過細節后，更讓人深覺“拳拳到肉”。在百度自研AI芯片加持下，飛槳的新算法、新模型和新能力，也正通過智能云被輸送到各種類型的流水線上。

具體細節，我們庖丁解牛，一點點看。

從強化到新增，視覺模型庫升級

這次飛槳升級的核心是視覺能力。最直接的變化，發生在飛槳的基礎模型庫PaddleCV（智能視覺）中。

首先是PaddleCV能力范圍進一步擴大。新版本的PaddleCV中，新增用于3D點云分類、分割和檢測的PointNet++和PointRCNN模型。

和此前PaddleCV支持的數十種模型一樣，基于飛槳框架，開發者無需全新開發代碼，只要進行少量修改，就能快速在工業領域實現3Ｄ圖像的分類、語義分割和目標檢測任務。

而且模型精度也有保證。飛槳框架中，PointNet++在Indoor3D數據上分割精度（MSG）為86.6%；ModelNet40數據集上分類精度（MSG）達90%——直追SOTA。

借鑒了PointNet++和RCNN的思想的PointRCNN，作為業內領先的3D目標檢測模型，在飛槳上實現，精度同樣能夠比肩SOTA。他們給出的實驗結果是：在自動駕駛權威數據集 KITTI（Car）的Easy數據子集上，精度達86.66%。

其次，PaddleCV進一步將各個領域新出現的強大模型納入進來。

比如在目標檢測領域，新增了基于COCO數據集的精度最高開源模型CBNet、Libra-RCNN模型的（精度提升了2%），以及Open Images V5目標檢測比賽最佳單模型。

飛槳還新增了IoU損失函數類型Generalized-IoU和Distance-IoU損失函數，在不增加預測耗時的情況下，模型精度再提升1%。

在圖像語義分割方面，新增了對高分辨率模型HRNet、實時語義分割模型Fast-SCNN的支持。在目標追蹤領域，新增了SiamFC、ATOM等算法模型。

但飛槳開發團隊也并非“只聽新人笑”，除了納入更多模型，此前已經支持的主流模型，也在飛槳的升級中得到優化。

比如YOLOv3，在這次升級中大幅增強，精度提升4.3%，訓練提速40%，推理提速21%；人臉檢測模型BlazeFace，新增了NAS版本，體積壓縮3倍，推理速度提速122%等等。

飛槳透露，這次新增產業實踐中廣泛應用的算法15個、35個高精度預訓練模型之后，PaddleCV庫中的高質量算法已經達到73個，預訓練模型總數達到203個。

而且這些，還只是飛槳這次升級的一部分而已。

模型開發、壓縮、部署“一條龍服務”增強

想要打造一個能夠落地到場景中的AI應用，不僅要開發訓/練模型，部署到應用場景中也是關鍵。

而在部署模型的過程中，還要針對部署的設備，調整壓縮訓練開發好的模型，使其能適應場景，且不喪失原有的精度。

圍繞這方面的需求，飛槳同樣強化了能力，最核心的提升在于模型壓縮工具PaddleSlim、移動端部署框架Paddle Lite。

在過去一年中，PaddleSlim歷經四個版本打磨，現在迎來了1.0版本——囊括了深度學習模型壓縮中常用的量化、剪裁、蒸餾、模型結構搜索、模型硬件搜索等方法。

應用到百度人臉SDK中，它能夠實現在嵌入式設備上，0.3秒內完成人臉檢測、跟蹤、活體檢測、識別等全流程操作。

而這不過是它這次升級后的新特性之一。這樣的特性，PaddleSlim1.0一共有10個。

比如，其針對YOLO系列模型開發的蒸餾方案，實現COCO任務的精度提高2%；使用裁剪模型壓縮方案時，它能夠大幅降低算力需求。在圖像分割模型上，應用PaddleSlim1.0的壓縮部署方案，FlOPS（算力）能減少51%。

而且，PaddleSlim1.0還開放了更加靈活的NAS API，預定義了更豐富的搜索策略和搜索空間。對比單卡SA搜索策略，單卡One-Shot策略實現搜索速度加快10倍以上等等。

PaddleSlim的這些特性，與最新版本的Paddle Lite結合，也進一步提升了飛槳的能力——將功能強大的深度神經網絡部署到移動嵌入式設備端上。

此外，飛槳還新推出了大規模分布式訓練工具PLSC，具備了千萬規模分類的能力。據悉，PLSC能自動將全連接層參數切分到多GPU卡，可以將單機8張V100 GPU配置下支持的最大分類類別數擴大2.52倍。

而且訓練精度和效率高：多個數據集上可以取得SOTA的訓練精度，同時支持混合精度訓練，單機8張V100 GPU配置下，混合精度訓練速度提升42%。

△開啟PLSC混合精度訓練方法。

更關鍵的是易用性。飛槳介紹稱，只需要五行代碼，在飛槳上就可實現千萬類別分類網絡的構建和訓練，提供大規模分類任務從訓練到部署的全流程解決方案。

可能也正是因為易用、不斷豐富的能力，飛槳的生態也正在進一步完善。截止2019年，飛槳的開發者數量已經超過150萬，是國內最大的AI開發者生態。

他們在將飛槳帶到更多應用場景中的同時，也在為飛槳能力提升提供更多的幫助。

飛槳為什么能夠實現快速發展，領銜中國深度學習平臺市場（來自IDC數據）？他們功不可沒。

此外，飛槳支持的硬件，尤其是國產芯片，也在進一步增多。據悉，繼華為麒麟芯片之后，比特大陸最新算豐系列AI芯片也已經與百度飛槳深度學習平臺的成功融合。

密集升級背后，為工業化大生產提供彈藥庫

模型庫愈發充足，端到端開發部署一條龍服務再度強化，飛槳的目標變得愈發清晰——工業化大生產。

這也是百度AI的目標所向，在過去的一年中，李彥宏、王海峰多次對外明晰：AI技術已經進入工業大生產階段，智能云作為載體，能夠促進AI落地，加快產業智能化進程。

百度在如何推進這一戰略？不斷迎來密集升級的飛槳，就是他們打造的武器，在百度自研芯片的支撐下，正通過百度智能云輸送到工業生產“前線”。

最新范例已經出現。3月15日，百度與微億智造打造的工業智能質檢設備，正式部署上線，雙方合作構建完成了一個從智能硬件到算法軟件再到算力供給的智能制造解決方案大閉環，實現算力2倍提升。

這背后，不僅僅有飛槳深度學習平臺的支持，還有百度智能云、百度昆侖芯片支撐——這也是中國自研 AI芯片在工業領域的首次大規模應用。

而且，不僅僅是智能質檢等工業方面的落地部署，在這次抗疫中，基于飛槳、智能云、昆侖芯片的百度軟硬一體化AI能力，也展現出了能力。

在2月10日的《新聞聯播》中，出現了這樣一則案例：

江蘇常州的精研科技，借助百度與微億智造聯合打造的智能自動化監測設備“表面缺陷視覺檢測設備”，解決了工人無法復工情況下的生產難題，十臺無人值守的智能化檢測設備24小時工作，比人工檢測效率提升近10倍。

近來大環境、大趨勢，疫情沖擊之下，全球經濟整體出現了不小的負面影響。但危中帶機——最大的機會莫過于轟鳴陣陣的新基建。

何為“新基建”？核心涵蓋，就是以新型智能化為方向的基礎設施建設。而2月10日的《新聞聯播》案例中，百度飛槳充當的，正是新基建需要的工具箱、彈藥庫。

然而，其中案例只是代表性的一例。

就目前而言，抗疫不斷收尾的中國大地上，這樣待升級的傳統產業、等待智能化變革的場景，以及AI發揮價值的降本增效領域，還有很多很多……

飛槳一系列升級，或許只是春江水暖，但也可能是躊躇滿志多年后恰逢其時。

總之，飛槳的新基建彈藥庫，現在已經準備好了。如果你是想抓住時代機遇的開發者，機會可別錯過了。

最后，飛槳PaddleCV這次的升級詳情，傳送門如下：

https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV

AI框架百度飛槳

乾明

15個產業級算法推出、35個高精度預訓練模型上線！最強國產開源AI框架再進化，密集提升視覺產業實戰能力

乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

從強化到新增，視覺模型庫升級

模型開發、壓縮、部署“一條龍服務”增強

△開啟PLSC混合精度訓練方法。

密集升級背后，為工業化大生產提供彈藥庫

相關閱讀

十年來最難的一屆CVPR：接收率22%，百度入選19篇，曠視16篇

集度獲4億美元A輪融資，百度和吉利繼續增持

Scaling Law百度最早提出！OpenAI/Claude受它啟發，致謝中有Ilya

文心一言全面免費了，深度搜索功能同時上線，第一手實測在此

百度文心大模型4.5系列正式開源同步開放API服務

文獻、報告、合同翻譯的老大難被國產工具治了？三大翻譯神器橫評后，這家穩得離譜

熱門文章

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

寧德時代給9萬+基層員工漲了薪！每月150元

前端沒死，AI APP正在返祖

云計算一哥10分鐘發了25個新品！Kimi和MiniMax首次上桌

15個產業級算法推出、35個高精度預訓練模型上線！最強國產開源AI框架再進化，密集提升視覺產業實戰能力

乾明 發自 凹非寺 量子位 報道 | 公眾號 QbitAI

從強化到新增，視覺模型庫升級

模型開發、壓縮、部署“一條龍服務”增強

△開啟PLSC混合精度訓練方法。

密集升級背后，為工業化大生產提供彈藥庫

相關閱讀

十年來最難的一屆CVPR：接收率22%，百度入選19篇，曠視16篇

集度獲4億美元A輪融資，百度和吉利繼續增持

Scaling Law百度最早提出！OpenAI/Claude受它啟發，致謝中有Ilya

文心一言全面免費了，深度搜索功能同時上線，第一手實測在此

百度文心大模型4.5系列正式開源 同步開放API服務

文獻、報告、合同翻譯的老大難被國產工具治了？三大翻譯神器橫評后，這家穩得離譜

熱門文章

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創 語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

寧德時代給9萬+基層員工漲了薪！每月150元

前端沒死，AI APP正在返祖

云計算一哥10分鐘發了25個新品！Kimi和MiniMax首次上桌

乾明發自凹非寺
量子位報道 | 公眾號 QbitAI

百度文心大模型4.5系列正式開源同步開放API服務

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式