20分鐘,這個AI就能創造復雜藝術作品!1080顯卡就能跑
「分布式」神經網絡?
賈浩楠 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
20分鐘生成復雜的藝術作品,而且還是用英偉達上上代的1080顯卡?
現在神經網絡上手門檻這么親民了嗎?
沒錯,這是一個叫做neural-style-pt的風格遷移模型,基于Pytorch實現,而且剛剛開源!
有關這個算法模型的話題在Reddit上才發布一天,熱度接近2000。
neural-style-pt,真的酷炫又親民嗎?
豐富的融合方式
neural-style-pt是論文A Neural Algorithm of Artistic Style的Pytorch實現。
論文介紹了一種利用卷積神經網絡將一張圖片的內容,與另一張圖片的風格相結合的算法,就是我們熟知的“風格遷移”網絡。
比如,將《星空》的藝術風格映射到一張斯坦福校園的夜景照片上:
或者根據給定圖像的不同藝術風格,分別融合進目標圖片:
除了“分別”融合,還能把多個藝術風格融進一張圖片:
從左上角順時針開始風格分別為”星空 “+”吶喊”、”吶喊 “+”構圖七(瓦西里·康定斯基油畫)“、”坐著的裸女(莫蒂里安尼油畫)?“+”構圖七”、”坐著的裸體 “+”星空”。
在進行風格遷移時,添加“-original_colors 1”指令,還可以只改變風格,不改變原圖顏色:
1080卡就能跑?
根據后臺和優化器的不同,算法運行速度會有很大差異。
在Tesla K80上使用512像素圖片迭代500次時間參考:
- 后臺nn、優化器L-BFGS: 117秒
- 后臺nn、優化器 ADAM: 100秒
- 后臺cudnn -優化器L-BFGS: 124秒
- 后臺cudnn -優化器ADAM:107秒
- 后臺cudnn -cudnn_autotune -優化器L-BFGS: 109秒
- 后臺cudnn -cudnn_autotune -優化器ADAM: 91秒
而在GTX 1080上,相同基準下時間更快:
- 后端nn -優化器L-BFGS: 56秒
- 后臺nn -優化器 ADAM: 38秒
- 后臺cudnn -優化器L-BFGS: 40秒
- 后臺cudnn -優化器ADAM:40秒
- 后臺cudnn -cudnn_autotune -優化器 lbfgs: 23秒
- 后臺cudnn -cudnn_autotune -優化器ADAM: 24秒
結合當下1080卡的售價,不得不說,這樣的門檻,對于機器學習來說,已經很香了。
默認情況下,neural-style-pt使用后端進行卷積,L-BFGS進行優化。但會使用大量的內存,可以通過以下方法來減少內存的使用。
使用cuDNN,添加-backend cudnn來使用cuDNN后端。而使用ADAM時,添加-optimizer adam來使用ADAM而不是L-BFGS。
在默認設置下,neural-style-pt在系統上使用了大約3.7GB的GPU內存;切換到ADAM和cuDNN可以將GPU內存占用減少到大約1GB。
如何上手試玩
安裝neural-style-pt,首先要準備好Pytorch。
然后,使用下方一句話指令就能安裝已經訓練好的模型:
python models/download_models.py
安裝完以后,上手試玩也很簡單,一行代碼就能實現:
python neural_style.py -style_image-content_image
如果要載入多種風格,需要分隔不同的圖片文件名:
-style_image starry_night.jpg,the_scream.jpg
注意,圖片名稱要包含完整的地址路徑。
基本操作就是這些。
neural-style-pt還有一點強大的功能,就是可以使用多個不同的計算設備來處理高分辨率圖像。
不同的設備會輸出不同網絡層的計算結果。
你可以用-gpu指令控制使用哪些GPU和CPU設備,你也可以用-multidevice_strategy控制如何在不同設備上分割層。
例如,在一個有四個GPU的服務器中,指令“-gpu 0,1,2,3”,指按順序在GPU 0、1、2和3上進行處理。
同時給出 -multidevice_strategy 3,6,12指令,表示前兩層應該在GPU 0上計算,第3到5層應該在GPU 1上計算,第6到11層應該在GPU 2上計算,其余的層應該在GPU 3上計算。
根據你的需求調整-multidevice_strategy,可以達到輸出的最大分辨率。
下面是一張4016×2213分辨率圖像,是在使用8個Tesla K80 GPU的服務器上生成的:
1080顯卡入門,還能“分布式”計算,這么酷炫好玩低門檻的風格遷移網絡,趕快來試試吧~
傳送門:
https://github.com/ProGamerGov/neural-style-pt
- 中國汽車一哥加持,自動駕駛界「大疆」估值沖破百億2025-11-26
- 神盾金磚電池成功挑戰行業首個“整車+整包”帶電六大極端測試2025-09-02
- 對話吉利技術一號位:VLA大模型打底,沖刺全球最大機器人公司2025-09-02
- 全新嵐圖知音正式上市,20.29萬元起2025-08-28



