UC伯克利最新深度強(qiáng)化學(xué)習(xí)課程上線,視頻已上傳到B站
乾明 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號 QbitAI
又有新的AI學(xué)習(xí)資源上線了。
這次是來自UC伯克利的秋季課程:Deep Reinforcement Learning,課程代號CS 285,講解內(nèi)容為深度強(qiáng)化學(xué)習(xí)。
授課教授,依舊是獲得學(xué)生好評不斷的Sergey Levine教授。
這次課程上線后,多名網(wǎng)友強(qiáng)烈推薦大家學(xué)這門課。
有人表示,Sergey Levine絕對是最棒的教授之一,他不僅非常了解相關(guān)知識,而且也很好地解釋了它。
課程視頻、PPT同步放出
深度強(qiáng)化學(xué)習(xí),是人工智能發(fā)展的重大方向之一,備受各大科研機(jī)構(gòu)與公司青睞,也被一干業(yè)內(nèi)大佬認(rèn)為是實(shí)現(xiàn)通用人工智能最有可能的路徑。
在這門課程中,Sergey Levine教授將會對深度強(qiáng)化學(xué)習(xí)的理解基礎(chǔ)、實(shí)現(xiàn)方式以及核心算法進(jìn)行深入的講解,并布置相應(yīng)的家庭作業(yè)(代碼會在GitHub上放出)鞏固學(xué)習(xí)內(nèi)容。
這次課程,一共有22講,具體如下:
前三講都是入門內(nèi)容,講解課程概覽,深度強(qiáng)化學(xué)習(xí)的背景以及需要的工具。
從第四講開始,就會逐步正式進(jìn)入深度強(qiáng)化學(xué)習(xí)課程內(nèi)容,之后的課程大部分都是深度強(qiáng)化學(xué)習(xí)中的核心算法,比如Q學(xué)習(xí)算法、梯度策略等等。
最后幾講內(nèi)容,則與深度學(xué)習(xí)的落地應(yīng)用有關(guān),動手設(shè)計(jì)強(qiáng)化學(xué)習(xí)系統(tǒng)。
現(xiàn)在,課程仍舊在講授的過程中,相關(guān)的課程學(xué)習(xí)資源,也正在陸續(xù)放出,課程視頻與PPT內(nèi)容已經(jīng)公布到第9講。
如果你或者身邊的朋友需要,請收好下面的傳送門:
課程傳送門
課程主頁(包含PPT):
http://rail.eecs.berkeley.edu/deeprlcourse/
課程視頻(YouTube):
https://www.youtube.com/playlist?list=PLkFD6_40KJIwhWJpGazJ9VSj9CFMkb79A
課程視頻(B站,來自@愛可可-愛生活老師):
https://www.bilibili.com/video/av69455099/
課程討論區(qū):
https://www.reddit.com/r/berkeleydeeprlcourse/




