本科4篇頂會論文如何做到?清華特獎高天宇干貨分享:我是這樣寫論文、做實驗、與導師相處
清華官方推薦
魚羊 曉查 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
本科生,距離“科研”有多遠?
有人還處在“小朋友你是否有很多問號”的狀態,但也有人本科就連發頂會文章,光環閃瞎眾人。
其中可有什么秘訣?
清華本科特獎獲得者、清華計算機大四學生高天宇,帶著他的直播課,來現身說法了:
論文千千萬萬,硬核與水貨如何辨識?頭都想禿了也沒有idea怎么辦?被導師push到心態崩潰怎么辦?
量子位已經整理好了課堂筆記,快一起來一窺究竟:
這把打開本科生/嗑鹽小白科研之門的門鑰匙,到底長什么樣。
△清華官方推薦
如何看論文
預印論文網站、期刊/會議、公眾平臺……在這個信息爆炸的時代,論文也在爆炸式增長。
其中難免硬核與水貨齊飛,質量參差不齊。
那么,如何高效地讀論文呢?高天宇分享了他的小秘訣。
論文分類
首先,對論文進行分類:
△截取自高天宇直播課
對于與自己當前課題相關的論文,需要有一個全面的把握,對每一篇都應有所了解。
一方面,這些研究本身與你的研究非常相關;另一方面,在“撞題”的情況下,你正在做的項目可能已經被別人率先突破。
而別的子領域相關論文,可能過于細分,對于你當前的研究沒有太大啟發,可以略過。
不過,有一些論文對于整個大的研究領域都存在指導意義,那么也需要認真研讀、總結。
至于其他領域,比如CV之于NLP,取得重大突破的成果要了解,有可能會啟發本領域的相關研究。
水文第一定律:標題越長,是水文的概率越大
高天宇統計了深度學習三巨頭Bengio、Hinton和LeCun的論文,發現有這樣一個規律:引用排名前十的論文,標題通常在6個詞左右;引用排名后十的論文,標題長度則達到了約10個詞。
標題越短,往往干貨越多。
為了說明這樣一種可能性,高天宇“自黑”了一把。
先來看看這個論文標題:
Hybrid Attention-Based Prototypical Networks for Noisy Few-Shot Relation Classification
論文地址:https://www.aaai.org/ojs/index.php/AAAI/article/view/4604
仔細分析一番:
這篇“水文”的作者正是高天宇本人,中了AAAI 2019。
總之,標題不是絕對的,但通過標題,還是可以粗略地對論文進行辨識。
需要注意的是,使用這一判斷方法需要一定的本領域知識積累。
如何讀論文
挑出了想讀的論文,又該怎么去研讀呢?
高天宇表示:對于大部分論文來說,看摘要就夠了。
為什么這么說呢?以機器學習領域的論文為例,主要分為以下幾個部分:
- 摘要:研究意義(包括前人研究、研究的缺陷),研究方法,研究結果
- 簡介:很多大道理(解決了什么問題)
- 相關工作:文獻綜述
- 方法:細節
- 實驗:打臉專用(論文試金石)
- 結論:基本沒用(重復摘要)
所以,看完摘要,就能對這項研究有總體上的把握。如果感興趣,可以再按照上面劃出的重點,有選擇地詳讀。
文獻管理工具
當然啦,這么讀下來,接觸的論文數量還是很龐大的。為了防止讀了忘、重復讀等等問題,高天宇推薦了特獎自用文獻管理工具。
idea從哪來
做科研最難的是想出一個idea,創意是寫論文的開端。
你以為大神的idea都是在實驗室里想出來的嗎?并非如此。
高天宇覺得在這樣一些場景下,更容易迸發靈感,比如在床上休息、去洗手間的路上以及吃飯時間。
事實上在這些放松的時刻,我們更能去安下心來思考,阿基米德也是在洗澡的時候想到了浮力原理。
當然,idea不能靠憑空想象,要對自己的領域有足夠的認識。
首先系統性閱讀自己所在領域的論文,找到前人工作缺失的地方,這可能就是你可以研究的內容。
另外idea可以是補全自己之前的論文,或是在和別人的學術討論中得到。
idea的形式多種多樣,有原創的突破性工作,就像發明襯衫,也有排列組合、遷移、漸進的補充性工作,就像給襯衫裝上紐扣和前衣口袋,而灌水就像是在衣服背后縫了個口袋。
怎么做實驗
有了idea,就要通過實驗實現它。首先應避免主觀偏見對實驗的影響,不要帶著idea的目的去做實驗,把實驗結果都解釋成自己idea的正確性。
而是應該先否定自己的idea,在實驗得到正確結果后感到高興。即所謂的大膽假設小心求證。
以上只是實驗遵循的常規法則,高天宇另外補充了很重要的一條:MVP(最小化可行產品)。
每一步都是實現最小化的可運行產品,而不是先實現一個更大產品的零件。就像先做出滑板車、自行車再造出汽車,而不是先造出汽車的輪子。
在實驗中也有一定的步驟可參考:先做驗證性實驗,證明自己的idea可行,然后再開始做更進一步的實驗。對于復雜的實驗,應采用更簡單的替代方案。
緩解科研壓力,善與導師相處
說完了具體的科研方法,也要談談科研的周邊問題。如何緩解科研壓力,如何與導師相處。
因為科研的特殊原因,學生一般沒有特定的工作休息時間。找到合適的休息時間很重要。
經常高負荷做科研的同學,在忙碌的時候可以切換一下任務,平時也可以記錄日常工作,緩解自己拖延工作造成的心理壓力。
另外,還有一條看似違反常理的建議,那就是把事情推到明天,這不是鼓勵拖延,而是讓你從一天的忙碌中跳出思維定式,也許明天會有更好的解決方案。
很多同學與導師關系不夠融洽,高天宇也借此機會吐槽了一下導師。
但吐槽歸吐槽,科研還要繼續下去,和導師保持共同學習、共同合作的心態才行。
因為導師對你科研的指導作用很大,他對過往研究更了解,能對你的課題進行大方向的把控,實驗中更豐富的經驗,防止你走很多彎路。另外對于有出國深造意愿的同學,導師的推薦信能給你提供更好的機會。
學霸的時間管理心得
學霸的時間管理一定是優秀的,不然為什么人家能考第一,游戲還比你打得好。
高天宇就有一套自己的高效工作方式,他把事情分為4類:
緊急重要、緊急不重要、不緊急重要、不緊急不重要。
優先安排不緊急但重要的事情(比如看書、背單詞),因為這些可能會被其他緊急情況擠占。
不重要但是緊急的事情,可以通過deadline催促自己完成。
劃分一個特定的時間,專門用于處理瑣碎事務。
很多人覺得時間不夠用,其實很多事情并行處理,比如在做實驗的等待過程中寫論文。
另外高天宇推薦在電腦和手機上使用時間管理軟件,尤其推薦Things、Notion。
最后,在疫情期間,如何在家做科研?高天宇給出一條鄭重警告:千萬不要碰床!因為一旦接觸了床就再也起不來了。
希望這些技巧能為因疫情而無法恢復學習的你提供一些寶貴的人生經驗。
關于學霸高天宇
這次為大家分享科研經驗的高天宇,是清華大學計算機系2016級本科生,今年夏天即將畢業,在短短四年的本科生涯中,高天宇過得很充實:
2019年,他成為清華大學本科生特等獎學金獲得者,清華大學學生“未來學者”計劃成員。
4年里,高天宇總共在AI頂級學術會議上發表了4篇論文:兩篇AAAI、兩篇EMNLP。
高天宇從大一下學期就已經進入大公司實習。2017年5月,他在Momenta研究語義分割,2019年入選騰訊犀牛鳥精英人才計劃,至今一直在微信AI實習。
他還為清華大學的三個GitHub項目做出了主要貢獻,其中一個NLP項目——關系提取的開源軟件包OpenNRE——自去年上線以來獲2.3k星標。
另外他也是一名文藝愛好者,擔任過清華大學學生會文藝部副部長、計算機系學生會文藝部部長,至于優秀團員、學業優秀獎等各種獎項和榮譽更是數之不盡了。
目前高天宇的下一步去向,我們沒有打聽到準確消息。
如果你知道點什么,也歡迎告訴我們。
今日份學習筆記,就醬~
課程地址:
https://www.bilibili.com/video/av95344119
高天宇博客頁:
https://gaotianyu.xyz/about/
- 腦機接口走向現實,11張PPT看懂中國腦機接口產業現狀|量子位智庫2021-08-10
- 張朝陽開課手推E=mc2,李永樂現場狂做筆記2022-03-11
- 阿里數學競賽可以報名了!獎金增加到400萬元,題目面向大眾公開征集2022-03-14
- 英偉達遭黑客最后通牒:今天必須開源GPU驅動,否則公布1TB機密數據2022-03-05






