曠視6號員工范浩強:高二開始實習,“兼職”讀姚班,25歲在CVPR斬獲第四個世界第一
曠視“四冠王”
郭一璞 發(fā)自 融科資訊中心
量子位 報道 | 公眾號 QbitAI
初來乍到,這個人說話容易讓人覺得“狂”。
“我們將比賽結(jié)果提交上去,果不其然,是第一名的成績。”當他說出這句話的時候,表情沒有一絲波瀾,仿佛一切順理成章。
他說的是AI頂會CVPR上的一項挑戰(zhàn)賽結(jié)果,全球巨頭都有參與,AI高手均同場競技,第一名并不容易。
但如果你知道“他”叫范浩強。
一切就非常稀疏平常。
誰是范浩強?
當初那個奧賽金牌、保送清華姚班、高二加入曠視成為6號員工的天才少年,人稱小強,一度是AI界的江湖傳說。
曾經(jīng),他是國際信息學奧賽(IOI)金牌獲獎者,保送清華姚班,高二便受唐文斌邀請加入曠視創(chuàng)業(yè),在半工半讀的情況下保持姚班第一名的成績,在大一軍訓時期就完成了一篇ICCV論文,一個讓清華特獎得主陳立杰都感到智商被碾壓的男人。
而如今,他已經(jīng)是曠視研究院帶領(lǐng)70人團隊的算法總監(jiān)了,帶著一群平均年齡比自己大得多的研究員們,在圖像算法、團隊培養(yǎng)、商業(yè)化等各方面披荊斬棘,達成突破,研究領(lǐng)域涵蓋人臉與指紋安全,移動端影像算法,AI計算攝影。
巨大光環(huán)之下,范浩強倒毫無自視甚高之意,打趣的說自己“本科畢業(yè),兩年工作經(jīng)驗,在貴司也就這樣吧”。
正如清華計算機系常被稱作“貴系”,這里的“貴司”當然也是指的曠視。
靠商用算法拿到學術(shù)界冠軍
在范浩強的帶領(lǐng)下,今年的CVPR NTIRE真實圖像降噪挑戰(zhàn)賽,曠視以絕對優(yōu)勢的運行時間和最終結(jié)果拿到了Raw-RGB組的冠軍。
“圖像降噪其實也是一件挺神奇的事情。” 介紹起這個被稱作“超畫質(zhì)”的技術(shù),范浩強如同在描述一件壓箱底的寶貝。
這個技術(shù),能夠?qū)⑹謾C拍到的充滿噪點的圖片:
變成和人眼看上去的效果一致,完美無瑕的樣子:
而這個在學術(shù)界剛剛拿到冠軍的降噪算法,范浩強團隊從去年春天開始,做到去年10月完成,目前在產(chǎn)業(yè)界已經(jīng)實現(xiàn)產(chǎn)品化,并開始商用,曠視多家客戶都在自家的手機上用到了這個算法。
相比之下,拿到冠軍反而是順便的事。
范浩強說:“我們的工作當然也是基于學術(shù)界已有的基礎(chǔ),目前我們?nèi)〉昧诵碌倪M展,自然也要回饋給研究社區(qū),以便能夠讓技術(shù)進一步向前發(fā)展。”
手機圖像降噪算法是范浩強近幾年最為得意的成果,而在此之前的本科時期,他已經(jīng)在人臉識別、人臉檢測方向帶領(lǐng)團隊為曠視拿下三個頂會級比賽的世界第一了。
在寢室里改變世界
回想起剛剛加入曠視的2012年,人臉識別在業(yè)界還是“不靠譜的事”,不少業(yè)界名人都認為,人臉識別這件事不可能靠機器自動完成,必須依賴人類的眼睛才能實現(xiàn)。
但還是個高二學生的范浩強卻覺得,只有做“不靠譜的事”,才有意思,才有發(fā)展的空間。他就是懷著這樣的心態(tài),成了曠視第一個“Rer”(Researcher,算法研究員)。
就這樣,人臉識別這件“不靠譜”的事情一做就是七年。
高中畢業(yè)之后,范浩強進入了清華天才輩出的姚期智班,開始了他的大學生涯。
在姚班的學習狀態(tài),范浩強自己說是“part time student, full time intern”,兼職讀本科,全職實習生,一半時間在學習,一半時間在工作,就這樣,還在四年間保持姚班第一的成績。
而他的第一篇頂會論文,正是在大一軍訓期間完成的,從沒寫過論文的他一次投稿后,收到了這樣的評價:
It is a shame that such a good method is not backed by a solid paper.
你方法這么好,文章寫得這個德性,是一種恥辱。
然而最后,論文還是被ICCV接收。足以見得,在2013年,用神經(jīng)網(wǎng)絡(luò)做人臉識別是相當稀缺的東西。
也正是因為這篇論文,曠視拿下了ICCV 2013 300 Faces in-the-Wild Challenge人臉關(guān)鍵點定位的冠軍,這也是曠視獲得第一個技術(shù)評測世界冠軍。
隨后的2014年,又是大豐收的一年。范浩強先是為曠視拿下世界權(quán)威人臉檢測公開評測集FDDB(Face Detection Dataset and Benchmark)人臉檢測賽項的第一名。
之后,又拿下了互聯(lián)網(wǎng)圖像人臉識別競賽LFW(Labeled Faces in the Wild)的第一名。
這項冠軍來的并不容易,創(chuàng)業(yè)早期的曠視條件艱苦,在研究人臉識別的時候,連GPU集群都沒有,范浩強獨自一人在學校寢室,在從外部云服務租來的集群上訓練,終于拿下了LFW(Labeled Faces in the Wild)競賽的第一名。
正在他春風得意的時候,印奇發(fā)來一封郵件,強烈要求“不要在寢室里改變世界了,下周一務必來公司一趟”。
一年內(nèi)兩個冠軍,加上2013年的ICCV,三個世界第一,讓曠視在計算機視覺領(lǐng)域一舉成名,原本“不靠譜”的人臉識別,也逐漸成為現(xiàn)實,應用在了各類機構(gòu)、場景,以及千萬人的手機上。
“信仰流”leader
除了研究成果不斷奪冠,在范浩強讀本科的這幾年,曠視也處于高速發(fā)展階段,各種產(chǎn)品都開始在行業(yè)內(nèi)大放異彩,也成功自研了深度學習框架Brain++。
而在資本層面,范浩強在清華讀書期間,曠視也不斷受到創(chuàng)新工場、螞蟻金服、啟明創(chuàng)投等多家機構(gòu)的青睞,迅速從A輪發(fā)展到C輪(如今已到D輪),成為行業(yè)領(lǐng)軍的獨角獸。
正是在這樣飛速發(fā)展的背景之下,范浩強沒有和大多數(shù)姚班同學那樣繼續(xù)深造,而是直接追隨人臉識別浪潮,成為了曠視全職員工。
對范浩強本人來說,從實習高中生,到全職研究員,曠視也逐漸從初創(chuàng)公司走向行業(yè)獨角獸。
“高中覺得這是個玩的東西,是個game;本科覺得是個job;畢業(yè)后覺得是個mission。在AI的商業(yè)化應用之路上,前方已經(jīng)沒有別人,現(xiàn)在輪到我們這群人來繼續(xù)推動它的發(fā)展。”
而這期間,從參與曠視的建立,到完成人臉識別的一系列工作,拿下第一桶金,成為準備影響人類科技樹的人,范浩強不僅擁有了“想做的事都能做成”的信心,更具備了一種使命感。
“連曠視這樣的公司都被外界稱作‘行業(yè)頭部企業(yè)’,由此可見整個行業(yè)都需要繼續(xù)被拯救。”范浩強無不戲謔地說。“以AI為代表的智能化技術(shù)將深刻的影響未來產(chǎn)業(yè)的格局,時代的浪潮已經(jīng)把我們推到了這里,擔子雖重,但是已經(jīng)是到了想上也得上,不想上也得上的時候了。”
而聽到范浩強這樣一個畢業(yè)兩年的年輕人講述這些宏愿的時候,你會覺得他是這個時代的風云人物,有一種舍我其誰的英雄氣概。不同于那個被多番吹捧少年天才,現(xiàn)在的他身上流露著一種歷史使命感,配上插科打諢的脫口秀式表達,會覺得仿佛在會見一個影視劇里才有的形象豐滿的人物。
也正是在他畢業(yè)后的這幾年,曠視本身再度突破,由“Face++曠視”升級為“MEGVII曠視”,圍繞核心AI技術(shù)原創(chuàng)深度學習框架Brain++,為個人設(shè)備大腦、城市大腦和供應鏈大腦三大核心應用場景賦能,推進人工智能及物聯(lián)網(wǎng)技術(shù)與實體經(jīng)濟加速融合,實現(xiàn)前沿科技規(guī)模化商業(yè)落地。
在這樣的發(fā)展進程下,生于1994年的范浩強已經(jīng)是曠視這家明星公司旗下曠視研究院帶70人團隊的算法總監(jiān)了。
這位曠視最年輕的總監(jiān),手下卻盡是年齡比自己大的同事,范浩強想了想,才想起了一位實習生是年紀比自己小的。
并且因為“保送即創(chuàng)業(yè)”,范浩強雖然從沒給自己寫過求職簡歷,卻經(jīng)常需要看別人的簡歷,面試候選人。
甚至有一次,他還不得不幫一位比自己年長十歲的候選人解答一下“人生遇到焦慮該怎么辦”。
在對團隊的態(tài)度上,范浩強自稱“信仰流”leader,給組員以自信,“使你相信你能做到”,和組員一起走下去。
“Leader分幾種,有的是Manager,就是管你的,有些就是跟你一起走的,我成長中遇到的基本都是后者,包括孫劍在內(nèi)。”
在組員們看來,他們或許覺得范浩強名聲在外,是心目中的偶像;或許覺得是身邊的好友,會夜里睡不著覺跑來聊天;或許覺得是一起成長的伙伴,可以一起相互幫助走下去。
而對組員們,范浩強希望能“至少以小強為baseline(基線)”,具有一個人能把一個方向的事情做好的能力。
給范浩強以希望的,是曠視研究院強大的研發(fā)力量:數(shù)百人的團隊,85%來自國內(nèi)Top10高校,70個以上的奧賽金牌,前途不可限量。
實踐派研究者
至于范浩強自己在技術(shù)上的“秘訣”,恐怕要用他一直在提的一句話來概括,那就是:
Engineering is magic。
來源于馬斯克的一條推特。
提及大一的landmark論文,范浩強總結(jié)的經(jīng)驗是:Engineering is magic。
“很多事情也沒什么神奇的,就是你把所有環(huán)節(jié)都做對了,就做了一個別人之前沒做到的事情。人臉識別發(fā)展至今有魔法么?沒有任何魔法,現(xiàn)在翻出1990年的paper肯定能找出很多本質(zhì)一樣的東西出來,但就是在你做的過程中,各個環(huán)節(jié)里面都有一些應該做對的事情。”
手機圖像降噪也一樣。
“Engineering is magic,想出這些點并不難,關(guān)鍵是要真的一張一張去親眼多看實驗數(shù)據(jù)。”
而現(xiàn)在,范浩強對engineering有了更高的要求,更宏大的目標。
他說,目前自己的一塊工作重心是實現(xiàn)算法生產(chǎn)的工業(yè)化體系,讓數(shù)據(jù)、新算法、訓練體系、測試、評估這幾個部分高效有機的在一起運行,今天給需求,明天給模型,“這是我們的目標,這條路并不平坦,還在努力過程中。”
另外,則是要回答AI有什么用的終極問題,涉及業(yè)務方向、應用場景的選擇,并進行商業(yè)化。
“在中國做商業(yè)化的AI其實是個嶄新的命題,歐美很多做得很好的算法公司一做就能活20年,因為有著成熟完善的商業(yè)競爭環(huán)境和嚴格的知識產(chǎn)權(quán)制度,國內(nèi)這方面就會差很多。要走中國特色商業(yè)化之路很難,但不妨礙我們把它做出來。現(xiàn)在我們做的工作是讓商業(yè)化的環(huán)境變好,使得那些讀完博再出來創(chuàng)業(yè)的同學有更好的環(huán)境。”
而engineering的能力,范浩強也希望能“遷移學習”到其他同學身上去,“曠視需要至少100個小強”。
而思考這些問題的,只是一位25歲的小哥哥,自帶一種身為領(lǐng)袖人物的、與年齡不相符的責任感。
演脫口秀,吸別人的貓
除了工作的時候是個大神,范浩強的另一個人設(shè)則是段子手,自稱“脫口秀演員里最會寫代碼的,碼農(nóng)里最會脫口秀的”。早年,曠視每一屆年會范浩強都會上臺表演脫口秀。
不過,常在河邊走,總有會翻車的時候。有一年曠視人數(shù)暴增,臺上的他愣是忘了詞。
到了第二年年會,前來指導的專業(yè)演員看了之后,評價說:“看了你去年的錄像,覺得很堅強。”
在專業(yè)演員的指導下,范浩強終于學會了如何鎮(zhèn)得住過千人的大場面。
范浩強的另一個愛好則是貓。但因為害怕養(yǎng)死,他選擇做一名“云吸貓”愛好者。
畢竟,范浩強自稱“0~24點都可能在工作”,恐怕是沒有時間鏟屎的。
因此,他甚至連招聘都在想,可以優(yōu)先招家里有貓的同學,這樣可以方便的借機擼貓。
One More Thing
最后,范浩強給想要從事AI技術(shù)的年輕人一條忠告:
弄斧要去班門,做AI要去專業(yè)公司。
他曾經(jīng)作為面試官向候選人提問如何完成一類產(chǎn)品,候選人反復論證,認為產(chǎn)品無法完成,因為需要的樣本量太大。
但這類產(chǎn)品在曠視已經(jīng)商業(yè)化了。有賴于曠視Data++的功勞,數(shù)據(jù)的標注和管理都不是問題。
“這個數(shù)量的樣本,直接去Data++提需求啊”范浩強說,“當你沒有見過一個以非常高的效率做AI的團隊和公司體系的樣子的時候,你是想象不到你能做到什么的。”
對于曠視而言,整個曠視研究院有多個像范浩強團隊這樣的研發(fā)大組,有眾多集天分與努力于一身的技術(shù)人才,正是AI界的“班門”,最當“弄斧”于此。
而這一點,在任何領(lǐng)域都是適用的。




