熟讀高數(shù)才能理解機(jī)器學(xué)習(xí)?不,初中數(shù)學(xué)就夠了
銅靈 編譯整理
量子位 出品 | 公眾號(hào) QbitAI
誰(shuí)說(shuō)理解機(jī)器學(xué)習(xí)必須要熟讀高數(shù)?
近日,數(shù)據(jù)科學(xué)Kyle在Medium發(fā)布博客表示,理解機(jī)器學(xué)習(xí)在做的事情,有初中數(shù)學(xué)知識(shí)足矣。
這篇博客簡(jiǎn)潔易懂、幽默風(fēng)趣,在Medium上幾天內(nèi)獲得600多贊。量子位將文章翻譯整理如下,與大家分享:
當(dāng)下理解我們?nèi)斯ぶ悄艿姆绞酵ǔ1容^極端,要么通過(guò)媒體,越來(lái)越聳人聽(tīng)聞的觀點(diǎn)讓人難以想象。要么通過(guò)文獻(xiàn),充滿(mǎn)晦澀語(yǔ)言和特定術(shù)語(yǔ)的論文讓人難以理解。
理解AI的正確姿勢(shì)應(yīng)該在兩個(gè)極端之間,這就需要你在新聞或文獻(xiàn)之外理性判斷,對(duì)于一般人來(lái)說(shuō),至少應(yīng)該知道AI是什么。
這幾乎是沒(méi)有門(mén)檻的,我認(rèn)為理解AI,中學(xué)數(shù)學(xué)知識(shí)就足夠了。這篇文章我將簡(jiǎn)化人工智能中的數(shù)學(xué),帶你撥開(kāi)云霧看本質(zhì)。
簡(jiǎn)單版AI和機(jī)器學(xué)習(xí)概念
能模仿人類(lèi)的智慧,這是最具代表性的AI的定義。
AI可以有多重“形態(tài)”,從虛擬游戲里的機(jī)器人、谷歌DeepMind開(kāi)發(fā)的下圍棋程序AlphaGo,到現(xiàn)實(shí)世界里索菲亞這樣的人型機(jī)器人,這都是AI“寄生”的場(chǎng)所。
那AI和相關(guān)報(bào)道中經(jīng)常提到的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是什么關(guān)系,請(qǐng)看下面這張圖:
人工智能(AI):泛指任何可以讓計(jì)算機(jī)模擬人類(lèi)智慧的技術(shù),可以通過(guò)邏輯、if-then等規(guī)則、決策樹(shù)和機(jī)器學(xué)習(xí)(包括深度學(xué)習(xí))等方法實(shí)現(xiàn)。
機(jī)器學(xué)習(xí):AI的一個(gè)子分類(lèi),讓機(jī)器通過(guò)真實(shí)世界的數(shù)據(jù)去“學(xué)習(xí)”,而非單調(diào)執(zhí)行預(yù)先設(shè)定的規(guī)則。
深度學(xué)習(xí):機(jī)器學(xué)習(xí)的子類(lèi),包含一系列算法。機(jī)器通過(guò)多層神經(jīng)網(wǎng)絡(luò)去處理數(shù)據(jù),自己學(xué)習(xí)去執(zhí)行任務(wù)。在語(yǔ)言和圖像識(shí)別等任務(wù)中經(jīng)常看到。
發(fā)現(xiàn)了么,機(jī)器學(xué)習(xí)的最大特色之一,就是它的“學(xué)習(xí)”方式不同了。這里的“學(xué)習(xí)”,其實(shí)也沒(méi)有看起來(lái)那樣有未來(lái)感,你在初中可能就已經(jīng)接觸過(guò)了。
如果你看過(guò)《黑鏡》里類(lèi)似的橋段,就比較容易將現(xiàn)在AI可視化成一個(gè)有意識(shí)的實(shí)體,一個(gè)有思想、感覺(jué)、可以做出復(fù)雜決策的物體。
在媒體的報(bào)道中這種觀念更為普遍,甚至經(jīng)常會(huì)把AI人格化,然后將其與電影《終結(jié)者》里的天網(wǎng)(Skynet)和《黑客帝國(guó)》里的Matrix相提并論。
實(shí)際上這都不是真的。在現(xiàn)階段AI就是數(shù)學(xué)。有時(shí)是高難度的數(shù)學(xué),有時(shí)需要擴(kuò)展到計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)等其他領(lǐng)域的知識(shí)。但AI的核心是一種數(shù)學(xué)函數(shù)。
也就是說(shuō),機(jī)器學(xué)習(xí)可以從y=mx+b這個(gè)方程式來(lái)理解。如下圖所示,我們已經(jīng)知道了x值y值,此時(shí)需要讓一臺(tái)計(jì)算機(jī)通過(guò)輸入(x)和輸出(y)去思考兩者之間的關(guān)系,推斷出m和b的值。
這個(gè)公式推斷起來(lái)不難吧,y=1x+1,小學(xué)生也會(huì)做。就是這樣,我們創(chuàng)造一個(gè)公式來(lái)描述所給的數(shù)據(jù),這大體上也是機(jī)器學(xué)習(xí)在做的事情。
這之間最有趣的部分就是,怎樣教機(jī)器選擇最適合這些數(shù)據(jù)的公式。一旦找到這其中的關(guān)聯(lián),你還可以將它用圖表的形式表現(xiàn)出來(lái)。
你不懂的數(shù)學(xué),拿給機(jī)器去做吧
y=1x+1是個(gè)非常簡(jiǎn)單的例子,我們需要機(jī)器學(xué)習(xí)最主要的原因是,人類(lèi)無(wú)法在數(shù)百萬(wàn)量級(jí)的數(shù)據(jù)點(diǎn)中找到合適的公式,這就是計(jì)算機(jī)要去做的事了。
無(wú)論如何,必須有足夠多的數(shù)據(jù)才能找到正確的公式。如果我們僅僅有x=1和y=2兩個(gè)數(shù)據(jù)點(diǎn),輸出的函數(shù)也是千變?nèi)f化的,可能是y=2x,可能是y=x+1,,也可能是y=([x+1]*5–9)? + 1等等。
根據(jù)少量數(shù)據(jù)構(gòu)建公式,然后把它用到更多數(shù)據(jù)上,這個(gè)公式可能會(huì)出現(xiàn)大量錯(cuò)誤。
并且,現(xiàn)實(shí)世界總不可能一直這么完美。在下面這個(gè)動(dòng)圖中可以看到,機(jī)器會(huì)在一堆數(shù)據(jù)中進(jìn)行取舍,探索怎樣最大化去滿(mǎn)足這些數(shù)據(jù),進(jìn)而才去創(chuàng)造公式。
和數(shù)學(xué)課上那些規(guī)律輸入和輸出值不同,真實(shí)世界的數(shù)據(jù)更不可預(yù)測(cè),也更“參差不齊”。
△ 最佳公式
當(dāng)面對(duì)一堆變量時(shí),人類(lèi)找出合適公式的可能性更小了。只有x和y很容易,但如果y受x的1次方、2次方、100次方的影響呢?
人類(lèi)就hold不住了,但計(jì)算機(jī)可以。
現(xiàn)實(shí)生活中的機(jī)器學(xué)習(xí)和AI
來(lái)看一個(gè)現(xiàn)實(shí)生活中的例子。我在制藥領(lǐng)域工作,就舉個(gè)癌癥相關(guān)數(shù)據(jù)集的例子好了。
這個(gè)數(shù)據(jù)集中有兩個(gè)關(guān)于腫瘤大小的輸入變量,即半徑和周長(zhǎng),以及兩個(gè)潛在的輸出,即良性腫瘤和惡性腫瘤。用我們上述思路來(lái)考慮,這事就是這樣的:
- y:診斷結(jié)果,可以是0(良性)或1(惡性)
- x1:半徑
- x2:周長(zhǎng)
- 每個(gè)x都有一個(gè)位置的m,先稱(chēng)之為“某數(shù)”吧
- b:依然是一個(gè)未知數(shù)
那么這個(gè)線性方程長(zhǎng)什么樣?其實(shí)和上面的例子也沒(méi)什么太大區(qū)別:
診斷結(jié)果=(某數(shù)1×半徑)+(某數(shù)2×周長(zhǎng))+b
這樣看來(lái),這道題已經(jīng)脫離了人類(lèi)能力的范圍了,所以不用費(fèi)時(shí)間去找這么多變量與結(jié)果的關(guān)系了,我們可以讓機(jī)器去做,這之間就是機(jī)器學(xué)習(xí)!
傳送門(mén)
博客原文地址:
https://medium.com/s/story/machine-learning-for-anyone-who-took-math-in-8th-grade-60fa9198b5eb
- 腦機(jī)接口走向現(xiàn)實(shí),11張PPT看懂中國(guó)腦機(jī)接口產(chǎn)業(yè)現(xiàn)狀|量子位智庫(kù)2021-08-10
- 張朝陽(yáng)開(kāi)課手推E=mc2,李永樂(lè)現(xiàn)場(chǎng)狂做筆記2022-03-11
- 阿里數(shù)學(xué)競(jìng)賽可以報(bào)名了!獎(jiǎng)金增加到400萬(wàn)元,題目面向大眾公開(kāi)征集2022-03-14
- 英偉達(dá)遭黑客最后通牒:今天必須開(kāi)源GPU驅(qū)動(dòng),否則公布1TB機(jī)密數(shù)據(jù)2022-03-05



