微軟Excel竟能實現(xiàn)CV算法:亞馬遜工程師妙用,人臉檢測、字符識別都不在話下
十三 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
感覺計算機(jī)視覺操作起來很難?一個Excel就能搞定。
沒錯,就是我們經(jīng)常會用到的微軟電子表格軟件Excel。
通過它就能快速實現(xiàn)計算機(jī)視覺中的一些算法示例:人臉識別、霍夫變換都不在話下。
更重要的是,還不需要任何腳本或者第三方插件。
先來看下人臉識別的結(jié)果。
還能找到圖像的邊緣和線條。
這項好玩的技巧,是由亞馬遜首席工程師 Alok Govil 和 Venkataraman Subramanian共同完成。
網(wǎng)友們嘗試了“別樣的Excel”后驚呼:
當(dāng)你放大Excel時,圖像就會慢慢顯現(xiàn)出來,數(shù)值也能看到,太神奇了!
看到用簡單的Excel公式就可以做一些真正的計算機(jī)視覺,還清楚地解釋了核心概念和算法,真是太酷了。
這是一個驚人的想法!這也是 Excel 核心代碼極其強(qiáng)大和高效的證明,如此即時、交互,使得所有東西看起來都更簡單、更容易理解。
那么,Excel到底是怎樣做到如此驚人效果的呢?
簡單設(shè)置,導(dǎo)入數(shù)據(jù)
打開Excel,先來簡單的設(shè)置一下。
在“公式”這一欄里,找到“計算選項”,選中“手動”。
實驗所用的圖像是一張假的護(hù)照圖片,因為它包含線條、角、人臉圖像以及文本。
圖像是由像素組成的二維數(shù)組,每個像素通常都有紅色、綠色和藍(lán)色基色通道的值,而每個值是一個字節(jié)(0-255)。
然后用一段簡單的代碼將圖像中的數(shù)據(jù)讀取出來,并存儲為一個.csv文件。
存儲出來的數(shù)據(jù)如下:
然后在“開始”欄里,選擇“條件格式”里的“色階”。
對于“灰度”,我們將255映射為白色,將0映射為黑色。
改變公式,秒現(xiàn)CV效果
先來做一個熱身練習(xí),讓圖像變暗。
那么,以A1這個單元格為例,只需要在公式欄中輸入公式“Img!A1*0.7”,圖片涉及的所有單元格都“*0.7”即可。
接下來是二值化。
還是以A1單元格為例,公式為“IF(Img!A1>160, 255, 0)”,并應(yīng)用到所有單元格。
模糊圖像,就是將Excel一個矩陣的數(shù)值(例如4 x 4)取均值的過程,公式例如“AVERAGE(Img!A1:D4)”。
同樣的道理,設(shè)置相應(yīng)的公式后,也可以凸顯一些圖片內(nèi)容的邊緣。
還可以人臉識別。
以及字符識別,識別圖片中的“E”字母,當(dāng)然存在一個錯誤識別“L”的情況。
當(dāng)然,除了上述這些效果,計算機(jī)視覺中一些基本的算法也都有所涉及。
并且,作者對每個過程都做了相應(yīng)的描述,在GitHub上已開源。
快去體驗一下這別樣的Excel吧!
傳送門
GitHub項目地址:https://github.com/amzn/computer-vision-basics-in-microsoft-excel




