ICCV 2019最佳論文歸谷歌,中國(guó)入選論文最多,商湯57篇全球第一
乾明 栗子 魚(yú)羊 假裝發(fā)自 首爾
量子位 報(bào)道 | 公眾號(hào) QbitAI
剛剛,在韓國(guó)首爾,ICCV 2019最佳論文和其他各大獎(jiǎng)項(xiàng)全部揭曉。
在這個(gè)全球最重要的計(jì)算機(jī)視覺(jué)頂會(huì)上(與CVPR、ECCV并列),AI熱情繼續(xù)倍速增漲,中國(guó)力量依然閃耀——除了湯曉鷗任大會(huì)主席,中國(guó)學(xué)者的入選論文總數(shù)排名第一,各項(xiàng)奪冠數(shù)也遙遙領(lǐng)先。
只是這一次,最佳論文和最佳學(xué)生論文,均未出現(xiàn)華人身影。
最佳論文由以色列理工和谷歌研究院摘取,最佳學(xué)生論文屬于美國(guó)佐治亞理工。
而中國(guó)AI獨(dú)角獸公司商湯,加上其聯(lián)合實(shí)驗(yàn)室,共有57篇論文入選,其中包括口頭報(bào)告(Oral)論文11篇,成為公司維度上的全球No.1。
此外,曠視、華為、百度和騰訊,也都有不俗表現(xiàn)。比如曠視完成了最重要比賽COCO物體檢測(cè)的三連冠。
完整詳情,我們傳送如下:
最佳論文獎(jiǎng)
獲得最佳論文的是:SinGAN:Learning a Generative Model from a Single Natural Image (用一張自然圖片,學(xué)出一個(gè)生成模型)?。
成果來(lái)自以色列理工學(xué)院 (Technion) 和谷歌研究院。
http://openaccess.thecvf.com/content_ICCV_2019/papers/Shaham_SinGAN_Learning_a_Generative_Model_From_a_Single_Natural_Image_ICCV_2019_paper.pdf
SinGAN只用一張圖片訓(xùn)練,便可以捕捉圖像中,各種圖像塊的內(nèi)部分布 (internal distribution of patches) 。訓(xùn)練后,就能生成高質(zhì)量、多樣化的樣本,但與原圖帶有相同的視覺(jué)內(nèi)容:
SinGAN里面,有一個(gè)由許多全卷積GAN組成的金字塔,每只GAN負(fù)責(zé)在一種不同的尺度上學(xué)習(xí)圖像塊的分布。
這樣就可以生成新的樣本,任意大小任意縱橫比的那種。而在擁有顯著多樣性 (variability) 的同時(shí),也保留原圖的全局結(jié)構(gòu)和精細(xì)紋理。
與從前的那些單圖GAN方法相比,SinGAN不限于紋理圖像 (texture images) 生成,并且也不是條件GAN (conditional) :也就是說(shuō)它是從噪聲中生成樣本的。
實(shí)驗(yàn)顯示,SinGAN生成的圖像,常常被人類(lèi)當(dāng)成了真實(shí)的圖像。并且,研究人員在許多圖像操作任務(wù)里,都展示了SinGAN的作用:
把畫(huà)作變成照片、編輯圖像里的物體、把一個(gè)風(fēng)格的物體融入另一種風(fēng)格的畫(huà)面里、超分辨率,甚至把靜態(tài)圖變成動(dòng)畫(huà)也可以。
△ 左起:一作,二作,三作
這項(xiàng)研究的作者有三位。一作是來(lái)自以色列理工學(xué)院的博士生Tamar Rott Shaham,她的研究方向是圖像處理、計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí);
二作是來(lái)自谷歌研究院的Tali Dekel,在進(jìn)入谷歌之前,她曾經(jīng)是MIT CSAIL實(shí)驗(yàn)室的博士后。
三作是以色列理工學(xué)院的副教授Tomer Michaeli,也是一作實(shí)驗(yàn)室的老板。
最佳學(xué)生論文
獲得最佳學(xué)生論文的是PLMP:Point-Line Minimal Problems in Complete Multi-View Visibility(完整的多視圖可見(jiàn)性中的點(diǎn)線最小問(wèn)題)。
http://openaccess.thecvf.com/content_ICCV_2019/papers/Duff_PLMP_-_Point-Line_Minimal_Problems_in_Complete_Multi-View_Visibility_ICCV_2019_paper.pdf
論文的作者來(lái)自佐治亞理工學(xué)院,瑞典皇家理工學(xué)院和布拉格捷克理工大學(xué)。第一作者是佐治亞理工學(xué)院的Timothy Duff,他是數(shù)學(xué)專(zhuān)業(yè)的四年級(jí)博士。
對(duì)于通過(guò)校準(zhǔn)的透視相機(jī)完全觀察到的點(diǎn)和線的一般排列,Timothy Duff等人提出了所有最小問(wèn)題的完整分類(lèi)。他們證明總共只有30個(gè)最小問(wèn)題,對(duì)于6個(gè)以上的攝像機(jī),5個(gè)以上的點(diǎn)以及6條以上的線,則不存在任何最小問(wèn)題。
研究人員提出了一系列檢測(cè)最小值的測(cè)試,這些測(cè)試從對(duì)自由度進(jìn)行計(jì)數(shù)開(kāi)始,到對(duì)代表樣本進(jìn)行完整的符號(hào)和數(shù)字驗(yàn)證結(jié)束。
在論文中,對(duì)于發(fā)現(xiàn)的所以最小問(wèn)題,研究人員介紹了它們的代數(shù)程度,即解決方案的數(shù)量,以衡量其固有難度。結(jié)果顯示了問(wèn)題的難度是如何隨著視圖數(shù)量的增長(zhǎng)而增長(zhǎng)。
一些新的最小問(wèn)題在圖像匹配和3D重建中可能不具有很強(qiáng)的實(shí)用性。
其他各項(xiàng)大獎(jiǎng)
亥姆霍茲獎(jiǎng)
亥姆霍茲獎(jiǎng)由IEEE模式分析和機(jī)器智能(PAMI)技術(shù)委員會(huì)頒發(fā),旨在表彰十年前對(duì)計(jì)算機(jī)視覺(jué)研究產(chǎn)生重大影響的ICCV論文。
今年獲此榮譽(yù)的是Attribute and Simile Classifiers for Face Verification。
http://www.cs.columbia.edu/CAVE/publications/pdfs/Kumar_ICCV09.pdf
以及Building Rome in a Day。
https://grail.cs.washington.edu/rome/rome_paper.pdf
終身成就獎(jiǎng)
即Azriel Rosenfeld Lifetime Achievement Award。
本屆ICCV的終身成就獎(jiǎng),頒給了以色列魏茨曼科學(xué)研究院的計(jì)算機(jī)科學(xué)教授Shimon Ullman(西蒙·烏爾曼),他現(xiàn)在是魏茨曼AI中心主任。烏爾曼出生于1948年,今年71歲。曾任MIT教授。
他專(zhuān)注于物體和面部識(shí)別研究,在該領(lǐng)域做出了許多貢獻(xiàn)。
2008年,烏爾曼因?qū)φJ(rèn)知科學(xué)的理論貢獻(xiàn)而獲得大衛(wèi)·哈梅爾哈特獎(jiǎng)。
2014年,他因?qū)I和計(jì)算機(jī)視覺(jué)的貢獻(xiàn)而獲得了計(jì)算機(jī)科學(xué)領(lǐng)域的EMET獎(jiǎng)。
2015年,他被授予以色列數(shù)學(xué)和計(jì)算機(jī)科學(xué)獎(jiǎng)。
杰出研究獎(jiǎng)
今年的杰出成就獎(jiǎng) (Distinguished Researcher Award) ,有兩位得主。
一位是哥倫比亞大學(xué)計(jì)算機(jī)系的教授Shree Nayar,他以計(jì)算機(jī)視覺(jué)、計(jì)算機(jī)圖形學(xué)和計(jì)算相機(jī)領(lǐng)域的研究而聞名。
計(jì)算相機(jī) (Computational Camera) 的概念就是由Nayar本人提出的,他也是計(jì)算攝影研究的先驅(qū)。
在這個(gè)領(lǐng)域,他的發(fā)明包括了能夠捕捉360度影像、高動(dòng)態(tài)范圍 (High Dynamic Range) 影像、以及拍攝3D圖像的攝影設(shè)備。
Nayar與ICCV也頗有淵源。早在1990年和1995年,他的研究便獲得過(guò)ICCV的最佳論文獎(jiǎng)。
另一位是麻省理工學(xué)院 (MIT) 的計(jì)算機(jī)系教授William T Freeman,以計(jì)算機(jī)視覺(jué)領(lǐng)域的研究最為出名。
Freeman的研究方向,包括應(yīng)用于計(jì)算機(jī)視覺(jué)的機(jī)器學(xué)習(xí),用于視覺(jué)感知的貝葉斯模型,以及計(jì)算攝影;
他也在方向可控濾波器與方向可控金字塔 (steerable filters and pyramids) 、方向直方圖 (orientation histograms) 、通用視點(diǎn)假設(shè) (generic viewpoint assumptions) 等等方面,做出了貢獻(xiàn)。
Freeman曾經(jīng)四次在CVPR上獲得杰出論文 (Outstanding Paper Awards) 獎(jiǎng)項(xiàng)。
不斷刷新的記錄
與其全球AI頂會(huì)一樣,今年舉辦的ICCV 2019,也再度刷新紀(jì)錄。
總參會(huì)人數(shù)7501,workshop有60場(chǎng)。
直接推動(dòng)這一狀況產(chǎn)生的,是投稿數(shù)量的“暴漲”,今年ICCV收到了4303篇論文投稿,與上一屆2143篇相比,翻了一番還要多,作者數(shù)達(dá)到1萬(wàn)人。
但在論文接受方面,并沒(méi)有同步增長(zhǎng),其中1075篇接收,接受率僅有25.02%,上一屆是29%。
盡管參與人數(shù)更多,投稿論文更多,接受率降低,但中國(guó)力量依舊出彩。
ICCV 2019官方統(tǒng)計(jì),接收論文按國(guó)家分屬:中國(guó)第一、美國(guó)第二,德國(guó)第三。
中國(guó)有超過(guò)350篇論文入選,美國(guó)則超過(guò)310篇,兩強(qiáng)領(lǐng)跑之后,第三名的德國(guó)不到50篇。
但如果按算上身處其他國(guó)家或公司的華人,中國(guó)力量的影響力還不止于此。
根據(jù)學(xué)術(shù)頭條統(tǒng)計(jì),在本屆ICCV接收的1077篇論文中,一作是華人的論文有523篇,占比48.6%,接近一半。
論文投稿數(shù)量排名上,前三全部是華人。
其中阿聯(lián)酋國(guó)家級(jí)“起源人工智能研究院”CEO兼首席科學(xué)家邵嶺,以15篇論文入選占據(jù)榜首。
百度研究院的楊易和華為諾亞方舟實(shí)驗(yàn)室計(jì)算視覺(jué)首席科學(xué)家田奇都以10篇論文入選并列第二。
不僅僅只是個(gè)人,中國(guó)的高校和企業(yè)也有非常突出的表現(xiàn)。
學(xué)術(shù)頭條按照第一作者歸屬單位來(lái)統(tǒng)計(jì)的結(jié)果顯示,香港中文大學(xué)有30篇,中科院有26篇,清華有24篇,而在其他頂會(huì)上表現(xiàn)優(yōu)異的CMU、斯坦福等美國(guó)強(qiáng)校,入選篇數(shù)均未超過(guò)20篇。
在這個(gè)指標(biāo)上,中國(guó)高校&科研機(jī)構(gòu)已經(jīng)壓過(guò)了美國(guó)的同行。
企業(yè)/工業(yè)界,來(lái)自中國(guó)的力量,更是“制霸全場(chǎng)”,最具代表性的就是AI獨(dú)角獸們和各大科技公司。
商湯披露,商湯科技及聯(lián)合實(shí)驗(yàn)室共有57篇論文入選ICCV 2019(包含11篇Oral),同時(shí)在Open Images、COCO、LVIS等13項(xiàng)重要競(jìng)賽中奪冠。
曠視則是有11篇論文入選,并在重頭戲項(xiàng)目“COCO物體檢測(cè)挑戰(zhàn)賽”上拿下三連冠,以及今年新設(shè)立的Best Paper Award(最佳論文獎(jiǎng))。
華為、騰訊、阿里、百度等雖然沒(méi)有官方整體大數(shù)據(jù)披露,但旗下實(shí)驗(yàn)室都有實(shí)力展現(xiàn)。
華為諾亞計(jì)算機(jī)視覺(jué)方向,有19篇論文入選,騰訊旗下的優(yōu)圖實(shí)驗(yàn)室,入選13篇論文。阿里達(dá)摩院,也在這場(chǎng)頂會(huì)中拿下了一項(xiàng)世界冠軍,成果也已經(jīng)落地到了淘寶的拍立淘中。百度旗下實(shí)驗(yàn)室也獲得了兩項(xiàng)世界冠軍。
相比之下,在各大AI頂會(huì)霸榜的谷歌&DeepMind組合,雖然論文數(shù)量仍有近50篇論文入圍,但其領(lǐng)先優(yōu)勢(shì),已經(jīng)沒(méi)有太多。
又是一場(chǎng)“CICCV”
而且,中國(guó)并不只是參與者,也是其中的組織者以及贊助者。
此外,商湯創(chuàng)始人、香港中文大學(xué)教授湯曉鷗也是這次大會(huì)主席。
贊助商方面,中國(guó)企業(yè)的Logo也非常突出。
地平線、華為、商湯、騰訊優(yōu)圖等都是最高層次的鉑金贊助商,而深蘭科技、曠視、依圖等均是是金牌贊助。
如此狀況,其實(shí)也并不僅僅只是出現(xiàn)在這屆ICCV上,之前CVPR、NeurIPs、KDD等國(guó)際AI頂會(huì)上,中國(guó)力量就已經(jīng)亮眼,從參與到成績(jī),正在展示出全方位的實(shí)力。
目前,就差最佳論文等“皇冠明珠”上的臨門(mén)一腳。
以及下次AI頂會(huì),是不是也該考慮在中國(guó)舉辦了?
傳送門(mén)
最佳論文:
http://openaccess.thecvf.com/content_ICCV_2019/papers/Shaham_SinGAN_Learning_a_Generative_Model_From_a_Single_Natural_Image_ICCV_2019_paper.pdf
最佳學(xué)生論文:
http://openaccess.thecvf.com/content_ICCV_2019/papers/Duff_PLMP_-_Point-Line_Minimal_Problems_in_Complete_Multi-View_Visibility_ICCV_2019_paper.pdf
Honorable Mentions:
Specifying Object Attributes and Relations in Interactive Scene Generation
http://openaccess.thecvf.com/content_ICCV_2019/papers/Ashual_Specifying_Object_Attributes_and_Relations_in_Interactive_Scene_Generation_ICCV_2019_paper.pdf
Asynchronous Single-Photon 3D Imaging
http://openaccess.thecvf.com/content_ICCV_2019/papers/Gupta_Asynchronous_Single-Photon_3D_Imaging_ICCV_2019_paper.pdf
亥姆霍茲獎(jiǎng)獲獎(jiǎng)?wù)撐模?/p>
http://www.cs.columbia.edu/CAVE/publications/pdfs/Kumar_ICCV09.pdf
https://grail.cs.washington.edu/rome/rome_paper.pdf
ICCV 2019中選論文大列表:
http://openaccess.thecvf.com/ICCV2019.py
— 完 —




