AI啊,我這里有些羞羞的東西,你要不要看一眼?
判斷男性生育能力,準(zhǔn)確率超過(guò)90%。
郭一璞 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
自從AI火了之后,它的各種神奇應(yīng)用就層出不窮。
現(xiàn)在,有人已經(jīng)把AI用在男科♂診斷上,研究“小蝌蚪”。
沒(méi)錯(cuò),這是個(gè)正經(jīng)研究,出自挪威奧斯陸城市大學(xué),甚至還發(fā)了一篇Nature Science Reports。
解決的核心問(wèn)題是,如何讓AI來(lái)觀(guān)察“小蝌蚪”,進(jìn)而判斷男性的生育能力。
研究者們對(duì)著一群“小蝌蚪”的視頻研究了很久之后發(fā)現(xiàn):
你們熟悉的卷積神經(jīng)網(wǎng)絡(luò)(CNN)簡(jiǎn)直是自動(dòng)觀(guān)察小蝌蚪的神器。
相比傳統(tǒng)機(jī)器學(xué)習(xí),CNN可以更有效的對(duì)男性小蝌蚪的運(yùn)動(dòng)能力進(jìn)行分析,錯(cuò)誤率低至9%左右,也就是準(zhǔn)確率已經(jīng)超過(guò)九成了。
因此,將來(lái)如果有準(zhǔn)備當(dāng)爸爸的盆友,去醫(yī)院做檢查的時(shí)候,盯著你的“兒子”看的,可能就不是醫(yī)生,而是AI了。
小蝌蚪動(dòng)不動(dòng),影響當(dāng)爸爸的能力
在這項(xiàng)研究中,AI主要看的指標(biāo)是小蝌蚪的運(yùn)動(dòng)狀態(tài)。
先來(lái)科普一下,一個(gè)正常育齡男性能不能當(dāng)爸爸,和他生殖系統(tǒng)的很多因素有關(guān),單就基因的傳遞者小蝌蚪來(lái)說(shuō),它們的總數(shù)、形態(tài)、濃度等等因素都會(huì)影響男性的生育能力。
小蝌蚪的運(yùn)動(dòng)狀態(tài),也是其中一個(gè)重要指標(biāo)。
比如,有高速運(yùn)動(dòng)(progressive)的小蝌蚪,跑起來(lái)飛快,可以直線(xiàn)跑,也可以繞大圓圈跑,非常健壯;
還有低速運(yùn)動(dòng)(non-progressive)的小蝌蚪,跑的不快,或者在原地兜圈子,不太健壯;
也有一動(dòng)不動(dòng)(immotile)的小蝌蚪,太不活躍,很難找到另一半來(lái)合成受精卵。
而一個(gè)小蝌蚪想把自己的基因傳承下去,需要至少25微米/秒的運(yùn)動(dòng)能力,如果一位男士的小蝌蚪里能跑到這個(gè)速度的不到32%,那他可能就沒(méi)那么容易當(dāng)爸爸了。
因此,如果要診斷一位男士的生育能力,那就要去醫(yī)院里檢測(cè)他的精液樣本。
而這項(xiàng)研究,就是用傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法區(qū)分高速運(yùn)動(dòng)、低速運(yùn)動(dòng)和一動(dòng)不動(dòng)的小蝌蚪。
來(lái)自85個(gè)人的數(shù)據(jù)
那么,研究的第一步,要找個(gè)小蝌蚪數(shù)據(jù)集,于是……
他們找到了一個(gè)名叫VISEM的數(shù)據(jù)集。
這個(gè)數(shù)據(jù)集的作者找了85個(gè)人,這些人去實(shí)驗(yàn)室附近的小黑屋或者自己家里收集了一些精液樣本,然后研究人員把這些樣本放到顯微鏡下,錄2~7分鐘的視頻,視頻的幀率是每秒50幀。
除了視頻,數(shù)據(jù)集里還有這85個(gè)人的年齡、體重指數(shù)(BMI)和禁欲天數(shù)三個(gè)指標(biāo)。
先用機(jī)器學(xué)習(xí)算法
既然要比較傳統(tǒng)機(jī)器學(xué)習(xí)算法和CNN哪個(gè)辨別小蝌蚪運(yùn)動(dòng)狀態(tài)的能力強(qiáng),那就先上傳統(tǒng)機(jī)器學(xué)習(xí)。
第一步,要提取特征。
這里,研究者們用到了一個(gè)名叫LIRE(Lucene Image Retrieval)開(kāi)源庫(kù),然后用超過(guò)40個(gè)不同的算法測(cè)試了超過(guò)30個(gè)不同的特征。
最終選定了Tamura特征,這組特征里包括小蝌蚪的粗細(xì)程度、對(duì)照、方向性、線(xiàn)條形狀、規(guī)則度和粗糙度,并且分別用Tamura特征、數(shù)據(jù)集里85個(gè)人的數(shù)據(jù)和兩者兼顧做了三組辨別三種不同活力小蝌蚪的實(shí)驗(yàn)。
綜合三組實(shí)驗(yàn)的結(jié)果,有六個(gè)算法表現(xiàn)是最好的,他們是:簡(jiǎn)單線(xiàn)性回歸,隨機(jī)森林,高斯過(guò)程,序列最小優(yōu)化(SMOreg),彈性網(wǎng)和隨機(jī)樹(shù),識(shí)別的錯(cuò)誤率大概在11%左右。
不過(guò),用這些機(jī)器學(xué)習(xí)算法有一點(diǎn)麻煩:每次只能辨別出一個(gè)值,所以要針對(duì)三種活力不同的精子各運(yùn)行一次,比較費(fèi)時(shí)間。
再用深度學(xué)習(xí)方法
試完了傳統(tǒng)機(jī)器學(xué)習(xí)方法,再來(lái)試試深度學(xué)習(xí),用CNN來(lái)辨別。
這里不能直接用原始數(shù)據(jù),需要提前做一些處理,從視頻中提取原始幀,用光流生成幀序列的時(shí)間表示。
然后在用CNN來(lái)在這些處理后的數(shù)據(jù)上,再做一下那三組實(shí)驗(yàn),分辨三種不同活力小蝌蚪的數(shù)量,這下要方便地多,可以一下子辨別出三個(gè)值,不用跑三遍算法了。
△ 處理過(guò)程
最后運(yùn)行出來(lái)的結(jié)果,錯(cuò)誤率大約在9%左右。
相比前面的11%,錯(cuò)誤率明顯降低,效果要好得多了。
所以,用深度學(xué)習(xí)辨別精子活力,不僅比傳統(tǒng)機(jī)器學(xué)習(xí)的方法要好,而且可以只跑一遍算法,更快速便捷。
或許未來(lái),深度學(xué)習(xí)可以應(yīng)用到醫(yī)療實(shí)踐中,成為診斷男性不育的利器。
傳送門(mén)
論文
Machine Learning-Based Analysis of Sperm Videos and Participant Data for Male Fertility Prediction
作者:Steven A. Hicks, Jorunn M. Andersen, Oliwia Witczak, Vajira Thambawita, P?ll Halvorsen, Hugo L. Hammer, Trine B. Haugen, Michael A. Riegler
https://arxiv.org/abs/1910.13327
VISEM數(shù)據(jù)集
https://datasets.simula.no/visem/
參考鏈接
https://www.medicalnewstoday.com/articles/320160.php#what-is-sperm-motility
https://www.verywellfamily.com/sperm-motility-1960141
https://en.wikipedia.org/wiki/Semen_analysis
—?完?—
- MEET2020 | 百度景鯤:AI交互正在吃掉舊產(chǎn)品邊界,觸達(dá)移動(dòng)互聯(lián)網(wǎng)盲區(qū)用戶(hù)2019-12-10
- MEET2020 | 王硯峰揭秘搜狗AI技術(shù)體系:自然交互在左,知識(shí)計(jì)算在右,核心是語(yǔ)言2019-12-16
- MEET2020 | 曠視唐文斌:你到底給誰(shuí)創(chuàng)造了什么樣的價(jià)值?這是AI產(chǎn)品的靈魂拷問(wèn)2019-12-17
- MEET2020 | 快手劉霽:AI基礎(chǔ)能力決定每個(gè)公司AI的迭代和落地效率2019-12-20




