“請給我一個五彩斑斕的黑”,只需一行命令就能讓AI畫畫,OpenAI的Dall-E被大神復現
GitHub收獲1.1k星
曉查 發自 凹非寺? 量子位 報道 | 公眾號 QbitAI
OpenAI今年1月公布的Dall-E可謂艷驚四座,只需輸入一段話,就能根據內容輸出一幅畫。連吳恩達老師都不禁點贊。
比如讓它設計一個“像牛油果一樣的座椅”。
但是,OpenAI只在官網設置了幾種固定模板,代碼也沒有開源,用戶無法用AI設計出更多的圖片。
不過現在有個好消息,一位華人小哥Philip Wang已經復現了一個PyTorch版Dall-E,叫做Deep Daze。
他使用了OpenAI的CLIP以及斯坦福大學的Siren,可以在個人電腦上運行。
只需輸入在命令行中輸入一段描述,這個AI就能畫出各式圖片。
比如在綠色山丘上的薄霧(mist over green hills):
或者是“草地上的碎盤子”(shattered plates on the grass):
你覺得實際效果如何?
開發該項目的Philip Wang,就是在今年年初公布要復現Dall-E的那位大神,沒想到不到3個月的時間,這個項目已經如此強大,在GitHub上已收獲1.1k星。
安裝與使用
Deep Daze可直接通過pip安裝:
pip install deep-daze
安裝完成后,輸入以下命令運行。
imagine?TEXT?
其中imagine是命令,TEXT必須是一段不超過77個字符的英文描述,
為可選參數,
可加可不加。
如果我們想生成文章開始那張山中薄霧的圖片,就輸入以下命令:
imagine mist over green hills
中可加入的參數有:—deeper,獲取更高的圖像質量;—num-layers,指定網絡的層數……更多用法可以去GitHub項目主頁查詢。
如果擔心AI的想象力過于天馬行空,可以指定一張圖片,讓AI在此圖像基礎上想象。這樣就能保證圖像不至于太過離譜。
具體的命令如下:
imagine ‘description’ —start-image-path /path/to/picture.jpg
假設我們給AI一張披薩的圖片,讓它想象“上面鋪滿青椒的樣子”。
那么我們將上述命令中的描述改成“A pizza with green pepper”。
你以為這就是Deep Daze的全部?其實,它還有一個更強大的完全體——故事模式。
只需設置—create_story=True,就可以解鎖該模式,取消77個字符的限制,項目作者將美國詩人羅伯特·弗羅斯特的詩《雪夜林邊歇馬》輸入其中,得到了一段mp4視頻。
到這里我有點想讓AI畫一下“五彩斑斕的黑”,但貧窮限制了我的操作。
因為使用Deep Daze必須要安裝CUDA,而且最好在不小于8GB顯存的GPU上,才能獲得不錯的效果。而我現在根本買不起英偉達顯卡。
項目地址: https://github.com/lucidrains/deep-daze
版權所有,未經授權不得以任何形式轉載及使用,違者必究。
- 腦機接口走向現實,11張PPT看懂中國腦機接口產業現狀|量子位智庫2021-08-10
- 張朝陽開課手推E=mc2,李永樂現場狂做筆記2022-03-11
- 阿里數學競賽可以報名了!獎金增加到400萬元,題目面向大眾公開征集2022-03-14
- 英偉達遭黑客最后通牒:今天必須開源GPU驅動,否則公布1TB機密數據2022-03-05



