ICLR 2022論文雙盲通過卻被爆抄襲:數(shù)據(jù)算法全部照搬,第二頁幾乎空白
論文質(zhì)量差到網(wǎng)友以為是釣魚
博雯 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
最近,一篇已經(jīng)通過ICLR 2022雙盲評(píng)審的論文被曝“嚴(yán)重剽竊”!
還是算法直接截圖粘貼,圖表顏色都不改一下的那種!
就像是這樣,直接把ICLR 2020上的一篇論文的算法部分截圖,然后粘貼到自己的論文里:
(而原論文的算法部分可復(fù)制,也更加清晰)

還有架構(gòu)圖部分,除了標(biāo)注了“引用”的那句話,其余的從架構(gòu)圖本身到圖表下的說明,都與EMNLP 2020的一篇論文分毫不差:
不僅是算法和架構(gòu)圖,摘要、正文、實(shí)驗(yàn)結(jié)果部分也存在著大量的Ctrl+C內(nèi)容。
現(xiàn)在,這篇論文已經(jīng)被項(xiàng)目主席以“嚴(yán)重剽竊”為由直接Desk Reject:
而點(diǎn)進(jìn)作者的個(gè)人資料鏈接,能看到他的大部分工作內(nèi)容都與網(wǎng)絡(luò)安全相關(guān),并沒有發(fā)表過任何機(jī)器學(xué)習(xí)領(lǐng)域的論文。

但他抄襲的兩篇論文,偏偏都來自于機(jī)器學(xué)習(xí)領(lǐng)域的頂會(huì):


跨界抄襲、低得可笑的論文質(zhì)量、草率而毫不掩飾的剽竊行為,種種現(xiàn)象甚至都讓網(wǎng)友懷疑:
這簡(jiǎn)直就像是同行評(píng)議人的“虛擬測(cè)試”……作者不會(huì)真覺得別人發(fā)現(xiàn)不了他的抄襲吧?

「忠實(shí)原著」的論文
接下來,就讓我們順著ICLR項(xiàng)目主席列出的五條抄襲的證據(jù),來看看這篇論文。
五條證據(jù)分別指出的分別是圖表和算法幾個(gè)部分。
但實(shí)際上,涉事論文從摘要就已經(jīng)開始了它的表演。
在論文摘要中,作者提出了一種新的對(duì)抗性文本生成模型Text-Gen,能夠生成更有意義和多樣性的對(duì)抗性文本:
但如果和ICLR 2020里的這篇提出了CAT-Gen模型的論文摘要做個(gè)在線文本對(duì)比……
好家伙,你擱這兒找不同呢?
摘要過后,馬上就是這樣一頁:
(持續(xù)往下拉,沒錯(cuò),大片空白的第二頁)

開頭所展示的流程圖和算法也就是項(xiàng)目主席列出的第一條和第五條:
圖像100%復(fù)制粘貼還注明了引用;
來自其他論文的算法截圖則根本就沒有注明。

而剩下的三條展示實(shí)驗(yàn)結(jié)果的表格也是如法炮制,要么是無引用的直接截圖粘貼:

要么就是將原表格中的Android、phone、kitchen、shirt等名詞“別出心裁”地?fù)Q成了iPhone5、kindle、room、clothing……
還有“良心發(fā)現(xiàn)”修改了數(shù)據(jù)的Table 3,卻被評(píng)委無情吐槽:
你這數(shù)據(jù)還沒原文的好,不如不改……
一月多度的「學(xué)術(shù)不端」
抄襲者marwan omar來自美國佛羅里達(dá)州的圣里奧大學(xué)(Saint Leo University),主要研究網(wǎng)絡(luò)安全、智能手機(jī)安全、虛擬化等領(lǐng)域。
而其實(shí)在被項(xiàng)目主席直接懟臉拒稿之前,作者團(tuán)隊(duì)已經(jīng)在10月29日確認(rèn)撤稿:
這也讓有些網(wǎng)友表示疑惑:為什么已經(jīng)確認(rèn)撤稿之后還會(huì)發(fā)布審查評(píng)論?
下方有人猜測(cè):
看ICLR今年的評(píng)審指南,他們提到會(huì)通過評(píng)審標(biāo)記所有違反規(guī)則的行為,所以可能只有這篇“嚴(yán)重剽竊”的論文是這樣。
或者評(píng)審在作者撤稿的時(shí)候已經(jīng)差不多完成了。

當(dāng)然,如此跨界的抄襲也引來了不少網(wǎng)友真情實(shí)感地懷疑:這該不會(huì)是釣魚吧?
如果沒有被發(fā)現(xiàn),事后就可以發(fā)篇《我在機(jī)器學(xué)習(xí)頂會(huì)上投了篇廢話連篇的論文,而同行評(píng)審居然沒有發(fā)現(xiàn)》的博客!

還有人表示見怪不怪:ML領(lǐng)域的論文本來就長(zhǎng)期被剽竊,區(qū)別只是有沒有被發(fā)現(xiàn)而已。
現(xiàn)在已經(jīng)有越來越多的剽竊新聞被披露,而那些抄襲者只是想賭一把自己不會(huì)被發(fā)現(xiàn)。

現(xiàn)在想來,最近的「學(xué)術(shù)不端」事件確實(shí)有種一月N度的傾向。
僅說國內(nèi),北理工副教授張華平在11月1日就剛剛曝出,他帶的學(xué)生的碩士學(xué)位論文被南方某985高校學(xué)生陳某抄襲。
一兩個(gè)月之前,還有北理工碩士“原文照搬”NeurIPS論文,港科大碩士抄襲ICML論文。
以及8月份曝出的SCI期刊上的大量辣眼學(xué)術(shù)名詞,目的就是為了規(guī)避抄襲檢查:

只能說,不到今年的最后一刻,誰也不知道「2021年學(xué)術(shù)不端大盤點(diǎn)」中,又能多出哪些素材。
官方通報(bào):
https://openreview.net/forum?id=EO4VJGAllb?eId=Ks7TmTUsyXa
參考鏈接:
https://www.reddit.com/r/MachineLearning/comments/qkb6ga/plagiarism_case_detected_iclr_2022_newsdiscussion/



