色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

論文投Nature先問問GPT-4!斯坦福實測5000篇,一半意見跟人類評審沒差別

當然,高質量人類反饋仍然不可替代

豐色 發自 凹非寺

量子位 | 公眾號 QbitAI

GPT-4有能力做論文評審嗎?

來自斯坦福等大學的研究人員還真測試了一把。

他們丟給GPT-4數千篇來自Nature、ICLR等頂會的文章,讓它生成評審意見(包括修改建議啥的),然后與人類給的意見進行比較。

結果發現:

GPT-4提出的超50%觀點與至少一名人類評審員一致;

以及超過82.4%的作者都發現GPT-4給的意見很有幫助。

那么,這項研究究竟能給我們帶來何種啟示?

結論是:

高質量的人類反饋仍然不可替代;但GPT-4可以幫助作者在正式同行評審前改進初稿。

論文投Nature先問問GPT-4!斯坦福實測5000篇,一半意見跟人類評審沒差別

具體來看。

實測GPT-4論文評審水平

為了證明GPT-4的潛力,研究人員首先用GPT-4創建了一個自動pipeline

它可以解析一整篇PDF格式的論文,提取標題、摘要、圖表、表格標題等內容來構建提示語。

然后讓GPT-4提供評審意見。

其中,意見和各頂會的標準一樣,共包含四個部分:

研究的重要性和新穎性、可以被接受的潛在原因或被拒絕的理由以及改進建議。

論文投Nature先問問GPT-4!斯坦福實測5000篇,一半意見跟人類評審沒差別

具體實驗從兩方面展開。

首先是定量實驗:

讀已有論文,生成反饋,然后與真實人類觀點系統地比較出重疊部分。

在此,團隊從Nature正刊和各大子刊挑選了3096篇文章,從ICLR機器學習會議(包含去年和今年)挑選了1709篇,共計4805篇。

其中,Nature論文共涉及8745條人類評審意見;ICLR會議涉及6506條。

論文投Nature先問問GPT-4!斯坦福實測5000篇,一半意見跟人類評審沒差別

GPT-4給出意見之后,pipeline就在match環節分別提取人類和GPT-4的論點,然后進行語義文本匹配,找到重疊的論點,以此來衡量GPT-4意見的有效性和可靠度。

結果是:

1、GPT-4意見與人類評審員真實意見顯著重疊

整體來看,在Nature論文中,GPT-4有57.55%的意見與至少一位人類評審員一致;在ICLR中,這個數字則高達77.18%。

論文投Nature先問問GPT-4!斯坦福實測5000篇,一半意見跟人類評審沒差別

再進一步仔細比較GPT-4與每一位評審員的意見之后,團隊又發現:

GPT-4在Nature論文上和人類評審員的重疊率下降為30.85%,在ICLR上降為39.23%。

但這與兩位人類審稿人之間的重疊率相當:

人類在Nature論文上的平均重疊率為28.58%;在ICLR上為35.25%。

論文投Nature先問問GPT-4!斯坦福實測5000篇,一半意見跟人類評審沒差別

此外,他們還通過分析論文的等級水平(oral、spotlight、或是直接被拒絕的)發現:

對于水平較弱的論文來說,GPT-4和人類審稿人之間的重疊率更高,可以從上面的30%多升到近50%。

這說明,GPT-4對水平較差的論文的鑒別能力很高。

作者也因此表示,那些需要更實質性修改才能被接收的論文有福了,大伙兒可以在正式提交前多試試GPT-4給出的修改意見。

2、GPT-4可以給出非通用反饋

所謂非通用反饋,即GPT-4不會給出一個適用于多篇論文的通用評審意見。

在此,作者們衡量了一個“成對重疊率”的指標,結果發現它在Nature和ICLR上都顯著降低到了0.43%和3.91%。

這說明GPT-4是有針對性的。

3、能夠在重大、普遍問題上和人類觀點一致

一般來說,人類反饋中較先出現的意見以及多個評審員都提及的意見,最可能代表重要、普遍的問題。

在此,團隊也發現,LLM更有可能識別出多個評審員一致認可的常見問題或缺陷。

也就是說,GPT-4在大面上是過得去的。

4、GPT-4給的意見更強調一些與人類不同的方面

研究發現,GPT-4評論研究本身含義的頻率是人類的7.27倍,評論研究新穎性的可能性是人類的10.69倍。

以及GPT-4和人類都經常建議進行額外的實驗,但人類更關注于消融實驗,GPT-4更建議在更多數據集上試試。

作者表示,這些發現表明,GPT-4和人類評審員在各方面的的重視程度各不相同,兩者合作可能帶來潛在優勢。

定量實驗之外是用戶研究

在此共包括308名來自不同機構的AI和計算生物學領域的研究員,他們都在本次研究中上傳了各自的論文給GPT-4進行評審。

研究團隊收集了他們對GPT-4評審意見的真實反饋。

論文投Nature先問問GPT-4!斯坦福實測5000篇,一半意見跟人類評審沒差別

總體而言,超過一半(57.4%)的參與者認為GPT-4生成的反饋很有幫助,包括給到一些人類想不到的點。

以及82.4%的調查者認為它比至少一些人類評審員的反饋更有益。

此外,還有超過一半的人(50.5%)表示,愿意進一步使用GPT-4等大模型來改進論文。

其中一人表示,只需要5分鐘GPT-4就給出了結果,這個反饋速度真的非常快,對研究人員改善論文很有幫助。

當然,作者指出:

GPT-4也有它的局限性。

最明顯的是它更關注于“整體布局”,缺少特定技術領域(例如模型架構)的深度建議。

所以,如作者最后總結:

人類評審員的高質量反饋還是不可或缺,但大家可以在正式評審前拿它試試水,彌補遺漏實驗和構建等方面的細節。

當然,他們也提醒:

正式評審中,審稿人應該還是獨立參與,不依賴任何LLM。

一作都是華人

本研究一作共三位,都是華人,都來自斯坦福大學計算機科學學院。

論文投Nature先問問GPT-4!斯坦福實測5000篇,一半意見跟人類評審沒差別

他們分別是:

  • 梁偉欣,該校博士生,也是斯坦福AI實驗室(SAIL)成員。他碩士畢業于斯坦福電氣工程專業,本科畢業于浙江大學計算機科學。
  • Yuhui Zhang,同博士生在讀,研究方向為多模態AI系統。清華本科畢業,斯坦福碩士畢業。
  • 曹瀚成,該校五年級博士在讀,輔修管理科學與工程,同時加入了斯坦福大學NLP和HCI小組。此前畢業于清華大學電子工程系本科。

論文地址:
https://arxiv.org/abs/2310.01783

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
亚洲午夜在线观看| 大桥未久av一区二区三区中文| 黄色激情在线视频| 精品国产一区二区三区久久| 久久精品一区二区| 久久久久国产精品人| 国产精品视频免费播放| 精品亚洲一区二区三区四区五区| 欧美高清无遮挡| 欧美日韩精品免费看| 91香蕉视频导航| 久久99久久98精品免观看软件 | 97久久超碰精品国产| 欧美色涩在线第一页| 欧美激情18p| 日日噜噜噜夜夜爽爽| 麻豆国产精品一区| 性欧美18一19性猛交| 国产日产欧美一区二区视频| 亚洲精品美女网站| 99影视tv| 日本一区二区免费视频| 在线观看免费视频一区| 中文字幕乱码久久午夜不卡 | 欧美色图亚洲激情| 五月天婷婷在线观看| 亚洲国产人成综合网站| 久久夜色精品国产欧美乱| 欧美色图在线观看| 久久九九国产精品怡红院| 亚洲日本在线播放| 精品免费在线观看| 国产成人激情视频| 国产又粗又长又大的视频| 久久亚洲精品石原莉奈| 国产欧美一区在线| 日韩一中文字幕| 一级日韩一区在线观看| 校园春色 亚洲| 91片在线免费观看| 日韩在线精品一区| 国产真实老熟女无套内射| 国产成人在线观看网站| 国产精品美女久久久久aⅴ| www.亚洲天堂| 国产在线播放观看| 一级全黄裸体免费视频| 亚洲一区二区中文在线| 38少妇精品导航| 天天插天天操天天射| 国产99对白在线播放| 欧美日韩一区二区免费视频| 成人亲热视频网站| 欧美多人猛交狂配| 国产99精品国产| 中国人与牲禽动交精品| 免费超爽大片黄| 中文字幕乱码在线观看| 亚洲mv在线观看| 91在线中文字幕| 色婷婷国产精品免| 久久久亚洲欧洲日产国码αv| 中文字幕精品在线视频| 午夜激情在线观看视频| 日韩电影在线一区| 精品亚洲男同gayvideo网站| 中文字幕色呦呦| 国产情侣av在线| 日韩一区二区三区在线| 国产精品网址在线| 在线看黄色的网站| 综合五月激情网| 天天操天天摸天天舔| 免费无码毛片一区二三区| 亚洲欧美经典视频| 欧美成人久久久| 欧美日韩一区二区在线观看| 国产成人免费高清| 亚洲成人网在线| 午夜精品一区二区三区在线播放 | 成人激情动漫在线观看| 日本韩国欧美国产| 日本婷婷久久久久久久久一区二区| 欧美 日韩 国产 一区二区三区 | 日韩在线观看视频网站| 日韩激情视频在线播放| 日韩伦理在线免费观看| 丝袜美腿亚洲综合| 中文字幕日韩高清| 在线观看视频你懂得| 成人网页在线观看| 国产精品九九九| 免费中文字幕在线| 日韩欧美在线视频日韩欧美在线视频| 国产精品一区二区三区四区五区| 日本一级淫片色费放| 在线亚洲一区二区| 日本熟妇人妻xxxx| 另类人妖一区二区av| 欧美黑人巨大xxx极品| 9.1成人看片| 亚洲午夜电影网| 欧洲一区二区日韩在线视频观看免费 | 色婷婷综合久久久中文一区二区| 亚洲一区二区三区乱码| 懂色av成人一区二区三区| 亚洲欧美国产高清va在线播| 国产精品成人免费一区久久羞羞| 国产精品久久久99| 色视频一区二区三区| 人妻少妇精品无码专区久久| 色偷偷av一区二区三区| www国产视频| 亚洲国产精品视频| 中文精品无码中文字幕无码专区| 蜜乳av一区二区三区| 91精品国产高清久久久久久| 青青青在线免费观看| 欧美亚洲高清一区二区三区不卡| 免费国产a级片| 不卡欧美aaaaa| 韩国成人av| 亚洲av成人无码网天堂| 欧美激情在线观看| 男人的天堂一区| 亚洲精品国产精品自产a区红杏吧| 精品国产午夜福利在线观看| 亚洲精品少妇30p| 国产奶头好大揉着好爽视频| 国产精品资源在线看| 91天堂在线观看| a毛片在线免费观看| 欧美激情综合亚洲一二区| 欧美日韩综合一区二区| 日韩精品中文字幕在线| a视频免费观看| 欧美在线看片a免费观看| 99日在线视频| 精品久久久久久久久久久| 国产精品天天av精麻传媒| 亚洲手机成人高清视频| 亚洲不卡中文字幕无码| 中文字幕国产一区二区| 国内精品视频一区二区三区| 国产欧美日韩在线观看| 免费日韩在线观看| 国产精品欧美一级免费| 国产精品视频网站在线观看| 欧美韩国日本一区| 青春草国产视频| 国产精品久久久久影院| 国模吧无码一区二区三区| 亚洲美腿欧美偷拍| 国产精品久久久久9999小说| 亚洲激情中文1区| 亚洲视频第二页| 在线观看一区日韩| 一级性生活大片| 日韩欧美精品三级| 伊人久久久久久久久久久久久久| 亚洲老司机av| 天天爽夜夜爽夜夜爽精品| 精品国产一区二区三区久久| 无码人妻精品一区二区三区蜜桃91| 九九热r在线视频精品| 一级黄色录像大片| 国产精品入口免费视| 视频一区视频二区在线观看| 国产伦一区二区三区色一情| 国产精品99久久久| 一本一生久久a久久精品综合蜜| 国产精品免费久久| 亚洲高清免费在线观看| 欧美精品在线视频| 一级片一级片一级片| 久久婷婷国产麻豆91天堂| 国产三级在线观看视频| 国产精品对白刺激久久久| 97精品久久久久中文字幕| 99在线免费视频观看| 精品福利视频导航| 成人黄色短视频| 欧美精品18videosex性欧美| 污视频在线免费观看| 少妇免费毛片久久久久久久久| 国产精品五月天| 无码国产精品一区二区高潮| 精品久久久网站| 人人爽人人爽人人片av| 91在线免费观看网站| 2020国产精品| 久草福利在线观看| 主播福利视频一区| 成人免费视频国产免费麻豆| 欧美成人一区二区在线| 亚洲一区自拍偷拍| 日本少妇xxxxx| 国自产精品手机在线观看视频| 奇米精品一区二区三区在线观看| 中文精品无码中文字幕无码专区| 欧美日韩一区国产| 亚洲免费黄色网址| 精品福利影视| 亚洲不卡在线观看| 国产黄色的视频| 国产在线久久久| 国产精品三级av| 妺妺窝人体色WWW精品| 不卡伊人av在线播放| 污视频软件在线观看| 亚洲av首页在线| 国产精品欧美一区二区三区| 久久久无码人妻精品一区| 久久精品视频在线观看| 男人的天堂亚洲一区| a级网站在线观看| 欧美性色综合网| 日本三级小视频| 日韩高清国产精品| 日韩欧美在线观看视频| 欧美日韩国产精品一区二区三区 | 国产三级精品三级观看| 日本欧美一级片| av亚洲精华国产精华| 免费欧美一级视频| 综合激情国产一区| 另类的小说在线视频另类成人小视频在线 | 亚洲精品国产精品国自产在线| 97人妻精品一区二区三区| 午夜精品美女久久久久av福利| 欧美日韩一区二区精品| 一二三四国产精品| 999国内精品视频在线| 国产精品久久久久久久久动漫 | 大尺度在线观看| 欧美精品videosex极品1| 国产自产高清不卡| 俄罗斯女人裸体性做爰| 午夜伦理精品一区| 久久午夜羞羞影院免费观看| 精品无码国产一区二区三区51安| 久久久久亚洲精品国产| 国产欧美日本一区视频| 手机av在线看| 国产伦精品一区二区| 亚洲一区二区三区视频在线| 波多野结衣不卡视频| 美媛馆国产精品一区二区| 91国在线观看| 五月婷中文字幕| 成人中文字幕av| 久久免费视频这里只有精品| 国产在线精品免费| 亚洲永久精品ww.7491进入| 国产精品高潮视频| 亚洲永久精品国产| 91丨九色丨蝌蚪丨对白| a天堂资源在线观看| 一个人www欧美| 成人国产一区二区三区精品| 中文乱码字幕高清一区二区| 国产乱码精品一区二区三区卡| 色综合亚洲欧洲| 一级特黄特色的免费大片视频| 91亚洲大成网污www| 中文在线观看免费视频| 老汉色影院首页| 一区二区三区欧美日韩| 男人的天堂一区二区| 伊人婷婷久久| 久久夜色精品国产欧美乱| 久久久久久影视| 五月天婷婷丁香| 欧美日韩国产综合视频在线| 亚洲色图狂野欧美| 92国产精品观看| 国产精品不卡av| 久久精品香蕉视频| 欧美主播福利视频| 精品福利樱桃av导航| 污视频网站免费观看| 欧美大片免费播放器| 国产精品免费视频一区二区| 日韩午夜av电影| 久久综合九色欧美综合狠狠 | 中文字幕日韩一区二区三区不卡| 色婷婷av一区二区三区久久| 国产三级精品视频| 区一区二在线观看| www.日本在线视频| 国产精品久久国产精品99gif| 色综合久久六月婷婷中文字幕| 午夜激情在线视频| 国产精品高清无码在线观看| 超碰在线免费观看97| 97精品一区二区视频在线观看| 精品国产乱码久久久久久虫虫漫画| 中文字幕一区二区三区人妻四季| 五月天婷婷亚洲| 国产三级精品在线不卡| 亚洲女人被黑人巨大进入al| 亚洲精品免费在线播放| 国产精品自偷自拍| 国产精品1000部啪视频| www.亚洲视频.com| 国产中文字幕亚洲| 亚洲欧美国产另类| 欧美日韩国产中文字幕| 国产麻豆一精品一av一免费| 婷婷色中文字幕| 男女啪啪免费视频网站| 99九九视频| 中文字幕欧美日韩| 五月天网站亚洲| 国产成人在线电影| 97人妻精品一区二区三区视频| 老熟妇精品一区二区三区| 国产又粗又猛又爽又黄的网站| 欧美一区二区色| 日韩av在线免播放器| 午夜av一区二区三区| 国产一区二区三区蝌蚪| 亚洲欧美精品一区二区三区| 午夜剧场免费看| 国产成a人亚洲精v品在线观看| 国产精品高潮呻吟久久av黑人| 欧美不卡123| 欧美性xxxx18| 国产日韩欧美精品一区| 性一交一乱一精一晶| 日韩av黄色片| 四虎影成人精品a片| 日本精品福利视频| 欧美黑人xxxxx| 国产精品久久久久久一区二区| 亚洲国产欧美一区| 欧美日本韩国一区| 亚洲一级在线观看| 国内精品视频一区二区三区八戒| 97国产成人无码精品久久久| 中文字幕无码日韩专区免费 | 国产精品亚洲视频| 天堂v在线观看| 亚洲精品国产无码| 人妻av一区二区| 日韩a一级欧美一级| 狠狠精品干练久久久无码中文字幕| 国产精品露脸自拍| 欧美激情视频在线| 亚洲区在线播放| 在线免费观看日本欧美| 精品国产老师黑色丝袜高跟鞋| 91老师片黄在线观看| 日韩av一区二区在线影视| 中文字幕日韩国产| 国产一级特黄毛片| 久久久一二三区| av手机在线播放| 亚洲美女在线播放| 中文字幕一区二区三区乱码不卡| 麻豆三级在线观看| 国产天堂视频在线观看| 青青草影院在线观看| 欧美一区观看| 国产一区自拍视频| 国产亚洲一区二区三区在线播放| 国产精品美女免费| 欧美一区二区色| 欧亚精品在线观看| 久久久久久久国产| 久久久女人电视剧免费播放下载| 啊v视频在线一区二区三区| 亚洲女成人图区| 精品国模在线视频| 亚洲视频免费一区| 亚洲色图35p| 久久视频在线视频| 久久久av亚洲男天堂| 亚洲乱码国产乱码精品精天堂| 日韩一级二级三级精品视频| 这里只有精品电影| 亚洲国产中文字幕在线观看| 欧美一级日韩免费不卡| 欧美精品高清视频| 亚洲电影免费观看高清完整版在线| 日韩视频一区二区三区| 欧美性猛xxx| 777xxx欧美| 亚洲成人网在线| 久久久国产精品一区| 农村黄色一级片| 不卡av电影在线播放| 正在播放一区二区| 国产传媒国产传媒| 精品人伦一区二区| 国精产品一区一区| 国产精品av久久久久久无| 91动漫免费网站| 日韩精品视频免费播放| 中文字幕第99页| 国产91久久久| 久久99最新地址| 国产欧美日韩另类视频免费观看| 国产精品色哟哟网站| 亚洲欧美在线观看| 精品久久久在线观看| 欧美日韩mp4| 久久国产一区二区三区| 2020欧美日韩在线视频| 久久久久久国产免费|