AI進軍搖滾圈,老炮:這是啥?
藝術圈被科技圈卷到了嗎?
興坤 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
利用人工智能編曲,似乎已經不是一件新鮮事。
但是你有聽說哪個AI發布專輯嗎?
這個專輯的作者是一個叫DeepSlayerXL的智能程序,它基于Transformer-XL語言模型訓練,可以自動生成金屬樂數據。
AI寫歌早就不新鮮了,不會譜曲都不好意思說自己是人工智能,但是玩搖滾的AI,確實是第一次出現。
創作金屬樂的AI
DeepSlayerXL的開發者Bernhard Mueller,青年時期參與金屬樂隊演奏,由此產生創作金屬樂AI的想法。
Andrew Shaw開發的musicautobot,最符合搖滾音樂創作,Bernhard Mueller就在它的基礎上編寫代碼,改造出能夠自動生成金屬樂的程序DeepSlayerXL。
它的內核同樣離不開Transformer-XL語言訓練模型。
該程序將MIDI音樂數據,轉換為語言模型可識別的編碼文本,訓練具備自動生成token編碼數據的能力后,以同樣的規則轉換為MIDI音樂數據,完成編曲。
△對MIDI音樂進行token編碼轉化。
有時候AI也免不了偷懶,直接拿訓練過它的數據來用,也就是常說的通用和弦。
由于對整體結構沒有相應的訓練,DeepSlayerXL還無法做到寫出節拍一致結構完整的曲子。
也是這個原因,使得它創作的音樂不受拘泥,跨越多個流派,具備獨特的風格。
比如《Arab Spring》,就是DeepSlayerXL音樂專輯的其中一個作品。
試聽的直接感受就是,如果不說,誰又能想到這是莫得感情的AI創作的呢?
GPT-3點評金屬樂專輯
DeepSlayerXL金屬樂專輯,靈感起源于它的開發者Bernhard Mueller青年時期經歷。由于受新金屬運動的影響,它的歌曲風格多樣,集各類型搖滾樂特色于一體。
在Bernhard Mueller練習演奏過程,以及對其他歌曲二次創作過程,萌生出結合語言模型創作歌曲的想法,由此誕生DeepSlayerXL。
DeepSlayerXL創作出來的歌曲,聽來還是有點意思的,十分符合外行人對搖滾樂的印象。
比如《A Pumpkin’s Life》,誰聽了不得感嘆一句“好像就是這個味”。
GPT-3給這首歌做了個點評,畢竟只有AI更懂AI。
“這首歌和南瓜派沒有任何關系,它帶有80年代老式垃圾搖滾的痕跡。另外,這首歌的歌詞也讓它本身變得有趣,講述世界如何變得越來越危險,我們需要為接下來可能發生的事情做好準備。這是一個非常深刻的哲學問題?!?/p>
專輯中還有其他不錯的歌曲,相應的,像模像樣的GPT-3點評一個都沒少。
“《dark meter》與Pink Floyd甚至一些早期Talking Heads的音樂有更多共同之處,這是對熟悉流派的嘗試?!?/p>
“《This is the End》曲目融合了工業噪音和環境聲景,有時像在聽混音帶。但是會出現噪音無縫轉化為輕松旋律的聲音,這是一個有趣的節奏變化。”
用AI創作金屬樂
會寫歌的人工智能,誰不想體驗一下?
感興趣的朋友可以自行下載PyTorch模型,或者登陸Colab notebook在線平臺(鏈接均在文末)親自體驗。
調整音樂序列長度,通過修改這部分數據來實現。
還可以自己輸入一小段音樂片段,讓程序補全一首歌。
就算完全不懂搖滾,也不了解代碼,照樣可以創作屬于你的金屬樂。
DeepSlayerXL的原理
DeepSlayerXL編曲金屬樂(甚至還出專輯),具體是怎么做到的?
和基礎程序musicautobot一樣,它們都依賴于TransformerXL模型訓練數據。
用到的訓練數據集,是從網絡上抓取的3,604首俄羅斯MIDI歌曲。將每首歌向任意方向移調半步,由此獲得了18k完整的MIDI歌曲訓練數據。
在MIDI歌曲數據中,單一音符包含了間距和持續時間信息,并且在同一時間點可以存在多個音符。這樣的2D數據無法被Transformer模型識別,需要將其轉換為單一維度文本數據。
通過musicautobot標記和流行音樂Transformer的BAR標記規則,將每個音符的音高和時長用對應token編碼,并在標記中體現出音符演奏順序,解決多個音符疊加的識別難題。
鼓點信息由DRUM[NUMBER]標記補充表示,這樣,MIDI音樂數據就完全被轉化為由token編碼組成的文本(如前文所示)。
使用轉換為token編碼的MIDI數據集,對 TransformerXL 模型訓練200個小時,完成語言學習。
自動生成一系列token數據后,按照同樣的編碼規則,將其轉換為MIDI音樂數據,完成金屬樂創作。
參考鏈接:
https://muellerberndt.medium.com/rage-of-the-machine-an-ai-makes-metal-music-f299dc1f706a
PyTorch模型下載地址:
https://drive.google.com/file/d/1hIEQm5mwq0zfcXhHvq26fsuY8fTliWUI/view
Golab notebook地址:
https://colab.research.google.com/drive/10goN9RGLfRGf2waaz2ufMdpwtfdUNTGe?usp=sharing
— 完 —
- 蘋果芯片主管也要跑路!庫克被曝出現健康問題2025-12-07
- 世界模型和具身大腦最新突破:90%生成數據,VLA性能暴漲300%|開源2025-12-02
- 谷歌新架構突破Transformer超長上下文瓶頸!Hinton靈魂拷問:后悔Open嗎?2025-12-05
- 90后華人副教授突破30年數學猜想!結論與生成式AI直接相關2025-11-26




