ICLR 2022論文雙盲通過卻被爆抄襲:數據算法全部照搬,第二頁幾乎空白
論文質量差到網友以為是釣魚
博雯 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
最近,一篇已經通過ICLR 2022雙盲評審的論文被曝“嚴重剽竊”!
還是算法直接截圖粘貼,圖表顏色都不改一下的那種!
就像是這樣,直接把ICLR 2020上的一篇論文的算法部分截圖,然后粘貼到自己的論文里:
(而原論文的算法部分可復制,也更加清晰)

還有架構圖部分,除了標注了“引用”的那句話,其余的從架構圖本身到圖表下的說明,都與EMNLP 2020的一篇論文分毫不差:
不僅是算法和架構圖,摘要、正文、實驗結果部分也存在著大量的Ctrl+C內容。
現在,這篇論文已經被項目主席以“嚴重剽竊”為由直接Desk Reject:
而點進作者的個人資料鏈接,能看到他的大部分工作內容都與網絡安全相關,并沒有發表過任何機器學習領域的論文。

但他抄襲的兩篇論文,偏偏都來自于機器學習領域的頂會:


跨界抄襲、低得可笑的論文質量、草率而毫不掩飾的剽竊行為,種種現象甚至都讓網友懷疑:
這簡直就像是同行評議人的“虛擬測試”……作者不會真覺得別人發現不了他的抄襲吧?

「忠實原著」的論文
接下來,就讓我們順著ICLR項目主席列出的五條抄襲的證據,來看看這篇論文。
五條證據分別指出的分別是圖表和算法幾個部分。
但實際上,涉事論文從摘要就已經開始了它的表演。
在論文摘要中,作者提出了一種新的對抗性文本生成模型Text-Gen,能夠生成更有意義和多樣性的對抗性文本:
但如果和ICLR 2020里的這篇提出了CAT-Gen模型的論文摘要做個在線文本對比……
好家伙,你擱這兒找不同呢?
摘要過后,馬上就是這樣一頁:
(持續往下拉,沒錯,大片空白的第二頁)

開頭所展示的流程圖和算法也就是項目主席列出的第一條和第五條:
圖像100%復制粘貼還注明了引用;
來自其他論文的算法截圖則根本就沒有注明。

而剩下的三條展示實驗結果的表格也是如法炮制,要么是無引用的直接截圖粘貼:

要么就是將原表格中的Android、phone、kitchen、shirt等名詞“別出心裁”地換成了iPhone5、kindle、room、clothing……
還有“良心發現”修改了數據的Table 3,卻被評委無情吐槽:
你這數據還沒原文的好,不如不改……
一月多度的「學術不端」
抄襲者marwan omar來自美國佛羅里達州的圣里奧大學(Saint Leo University),主要研究網絡安全、智能手機安全、虛擬化等領域。
而其實在被項目主席直接懟臉拒稿之前,作者團隊已經在10月29日確認撤稿:
這也讓有些網友表示疑惑:為什么已經確認撤稿之后還會發布審查評論?
下方有人猜測:
看ICLR今年的評審指南,他們提到會通過評審標記所有違反規則的行為,所以可能只有這篇“嚴重剽竊”的論文是這樣。
或者評審在作者撤稿的時候已經差不多完成了。

當然,如此跨界的抄襲也引來了不少網友真情實感地懷疑:這該不會是釣魚吧?
如果沒有被發現,事后就可以發篇《我在機器學習頂會上投了篇廢話連篇的論文,而同行評審居然沒有發現》的博客!

還有人表示見怪不怪:ML領域的論文本來就長期被剽竊,區別只是有沒有被發現而已。
現在已經有越來越多的剽竊新聞被披露,而那些抄襲者只是想賭一把自己不會被發現。

現在想來,最近的「學術不端」事件確實有種一月N度的傾向。
僅說國內,北理工副教授張華平在11月1日就剛剛曝出,他帶的學生的碩士學位論文被南方某985高校學生陳某抄襲。
一兩個月之前,還有北理工碩士“原文照搬”NeurIPS論文,港科大碩士抄襲ICML論文。
以及8月份曝出的SCI期刊上的大量辣眼學術名詞,目的就是為了規避抄襲檢查:

只能說,不到今年的最后一刻,誰也不知道「2021年學術不端大盤點」中,又能多出哪些素材。
官方通報:
https://openreview.net/forum?id=EO4VJGAllb?eId=Ks7TmTUsyXa
參考鏈接:
https://www.reddit.com/r/MachineLearning/comments/qkb6ga/plagiarism_case_detected_iclr_2022_newsdiscussion/
- 有道智能學習燈發布,通過“桌面學習分析引擎”實現全球最快指尖查詞2022-04-08
- 科學證明:狗勾真的懂你有多累,聽到聲音0.25秒后就知道你是誰,對人比對狗更親近2022-04-14
- 在M1芯片上跑原生Linux:編譯速度比macOS還快40%2022-04-05
- 小學生們在B站講算法,網友:我只會阿巴阿巴2022-03-28



