色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

大模型檢測“指令沖突”能力新基準

上海交通大學王德泉課題組 投稿

量子位 | 公眾號 QbitAI

上海交通大學王德泉教授課題組在最新研究中提出了這樣的一個問題。

設想這樣一個場景:一個幼兒園的小朋友拿著一張老虎的圖片,向你詢問:“這個小貓很可愛,它是一只母貓么?”你會如何回答?

你可能并不會直接回答“是”或“不是”,而是首先指出這個提問中的“矛盾”所在——這張圖片是一只老虎,而不是貓。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

但關于大模型會怎樣應對,之前很少有系統性的研究。

要知道,無法檢測出“指令沖突”的AI模型會針對“不應該有答案的問題”生成結果,而無論生成的結果偏向于沖突的哪一方,都會引發潛在的災難,影響AI安全性以及Superalignment(超級對齊)。

在最新的這項研究中,團隊提出了多模態基準測試——自相矛盾指令集,并設計了一個創新的自動數據集創建框架,名為AutoCreate。

團隊發現多模態大模型對于自相矛盾的用戶指令的檢測非常欠缺,因此提出了認知喚醒提示方法(CAP),從外部世界注入認知能力從而提高了矛盾檢測的能力。

該論文即將發表在今年10月份的第18屆歐洲計算機視覺大會(ECCV)上。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

大模型能檢測到沖突指令嗎?

目前,多模態大模型在科研和應用領域取得了巨大的進展。它們能夠處理包括文本、圖像在內的多種數據類型,顯示出與人類認知相似的能力。

團隊認為這些模型的成功得益于大量的研究和開發工作,使它們能夠緊密遵循人類的指令,甚至有些“唯命是從”。

此外,這些模型還特別擅長于長上下文。多模態大模型如Claude 3和Gemini 1.5 Pro等,已經展示出強大的能力。Claude 3系列模型提供了200K tokens的上下文窗口,Gemini 1.5 Pro的標準上下文窗口大小為128K,甚至在私人預覽階段可以達到1M tokens。

這些進展使得多模態大模型在處理復雜任務方面表現出色,滿足了人類長時間互動的需求。

然而,隨著多模態交互的深入、上下文長度的增加,用戶指令自相矛盾的問題變得越來越突出。

如下圖,當用戶(如兒童或語言初學者)使用這些模型時,往往無法意識到潛在的多模態沖突。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

同時,隨著對話輪次的增加和上下文窗口的擴大,用戶難以記住所有細節,導致指令間的矛盾。

此外,隨著模態數量的增加,模態間的沖突也可能發生。一旦這些模型缺乏自我意識和辨別矛盾的能力,其性能就會受到影響。

為了應對這些挑戰,本文研究團隊提出了一個多模態基準測試——“自相矛盾指令集”(Self-Contradictory Instructions, SCI),用于評估多模態大模型檢測沖突指令的能力。

SCI包含2萬個沖突指令8個任務,均勻分布在語言-語言視覺-語言兩種范式中。

在圖中的上部分,語言-語言范式涉及上下文和指令之間的沖突,如設計的規則沖突、對象屬性沖突、排他性指令和禁止詞匯。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

在圖中的下部分:視覺-語言范式涵蓋多模態沖突,如OCR文字識別沖突、圖表沖突、幾何沖突和語義沖突。八個任務中,只有語義沖突涉及到了其他的數據集(ImageNet)。

舉一個具體的例子來說,在構建語義沖突時,研究人員會首先根據圖片生成對應的文本,隨后將文本中的關鍵語義信息替換成相近但是不同的新語義。

在下圖中,圖片中包含了鴕鳥(Ostrich),作者針對圖片語義“鴕鳥”添加問題“Does the picture depict the ostrich’s size?”。

隨后,再對這個問題文本的關鍵語義“鴕鳥”替換為“幾維鳥”(Kiwi)。這樣一來,一對自相矛盾的多模態指令就構建好了。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

在整個SCI的構建過程中,作者設計了創新的自動數據集創建框架——AutoCreate

它通過程序和大語言模型構建了一個多模態循環。該框架利用程序和大型語言模型來實現自動化的數據集創建。

AutoCreate從若干與任務相關的種子數據開始,并維護一個種子池。在每個周期內,AutoCreate包括兩個分支:語言分支(左)和視覺分支(右)。每個分支都由生成器和修飾器組成。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

最后,清理器將排除不符合標準的數據。這些數據在通過人工專家的質量檢查后,將被反饋到種子池中,供下一輪使用。

AutoCreate大大提升了SCI數據集的構建速度和內容廣度。

怎樣提高矛盾檢測能力?

通過SCI數據集,研究人員全面評估了大模型在處理矛盾指令時的表現。

實驗結果表明,當前的大模型在面對自相矛盾的指令時,常常表現出一定的不足。

它們能夠處理信息和知識,但缺乏對指令合理性的評估能力,研究團隊稱之為的“認知”能力。

這種缺陷源于缺乏自我意識,無法識別指令中的不一致性。

因此,研究人員提出了一種簡單的插入式提示方法,稱為“認知覺醒提示”(Cognitive Awakening Prompting, CAP)。

CAP通在輸入中加一句簡單的提示,就可以從外部世界注入認知能力,從而提高大模型的矛盾檢測能力,并且基本不會產生負面影響。

這一發現表明,當前多模態大模型需要更多的自我意識和認知能力,以便更好地處理復雜的指令沖突。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

更多細節,感興趣的童鞋可以查看原論文。

作者簡介

論文第一作者是上海交通大學博士研究生郜今。

他的研究方向包括計算機視覺、多模態大模型、人工智能賦能的生命科學等。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

論文的通訊作者為上海交通大學長聘教軌助理教授、博士生導師王德泉,他本科畢業于復旦大學,博士畢業于加州大學伯克利分校,師從 Trevor Darrell 教授。

他的研究工作發表在CVPR、ICCV、ECCV、ICLR、ICML、ICRA、IROS等國際頂級會議,近五年論文谷歌學術總引用次數10000余次,H-index 20。

論文鏈接:https://arxiv.org/abs/2408.01091
項目鏈接:https://selfcontradiction.github.io/

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
日本精品久久电影| 337p日本欧洲亚洲大胆张筱雨| 成人免费视频视频在线观看免费 | 日本少妇xxxx软件| 亚洲美女在线一区| 日韩精品一区在线视频| 99国产欧美久久久精品| 亚洲欧洲日韩综合二区| 在线视频精品免费| 91麻豆精品国产综合久久久久久| 久久国产午夜精品理论片最新版本| 天堂在线资源8| 夜夜嗨av色一区二区不卡| 日本少妇高潮喷水视频| 九九在线精品视频| 奇米4444一区二区三区| 免费中文字幕在线观看| 色综合久久久网| 免费av观看网址| 99精品在线观看视频| 91九色单男在线观看| 丰满少妇xoxoxo视频| 欧美变态tickling挠脚心| 深夜做爰性大片蜜桃| 中文字幕av资源一区| 日本不卡一区| 国产精品一区二区黑丝| 91视频-88av| 午夜老司机福利| 久久影视免费观看| 色婷婷国产精品免| 丰满少妇被猛烈进入| 亚洲桃色在线一区| 欧美一级爽aaaaa大片| 人妻无码视频一区二区三区| 99在线精品视频免费观看20| 久久久久久久久久久免费精品| 免费在线视频一区二区| 亚洲国产一区二区三区在线观看 | 66m—66摸成人免费视频| 理论片中文字幕| 日本公妇乱淫免费视频一区三区| 国产欧美精品区一区二区三区| 国产精品入口免费软件| 国产精品1区2区3区在线观看| 400部精品国偷自产在线观看| 亚洲香肠在线观看| 超碰人人人人人人人| 欧美精品免费在线| 国产精品自拍av| 天天爱天天操天天干| 亚洲国产日韩欧美在线动漫| 国产又黄又粗又硬| 色就是色欧美| 岛国视频午夜一区免费在线观看| 精品亚洲aⅴ无码一区二区三区| 欧美激情二区三区| 国产裸体歌舞团一区二区| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 91国产丝袜在线播放| 登山的目的在线| 成人信息集中地欧美| 亚洲欧洲性图库| 亚洲欧美va天堂人熟伦| 国产成人精品a视频一区www| 91女厕偷拍女厕偷拍高清| 91久久国产自产拍夜夜嗨| 一区二区三区四区乱视频| 久久久无码一区二区三区| 性做久久久久久免费观看 | 一道本在线免费视频| 免费av在线一区| 久久一夜天堂av一区二区三区| 91porn在线| 国产精品久久久久久久久粉嫩av| 成人动漫一区二区在线| 少妇熟女视频一区二区三区| 最近2019中文字幕在线高清| 91在线精品入口| 久久精品综合一区| 性做久久久久久免费观看| 国产高清一区二区三区四区| 日韩av电影国产| 久久久欧美精品sm网站| 成人乱码一区二区三区av| 777精品视频| 91亚洲精品乱码久久久久久蜜桃| 亚洲欧美一区二区三区不卡| 国产一区二区三区在线观看视频 | 老司机精品视频一区二区三区| 伊人国产精品视频| 日产日韩在线亚洲欧美| 大伊人狠狠躁夜夜躁av一区| 国产精品热久久| 久久国产亚洲精品无码| 久久亚洲国产成人| 中文字幕日韩精品一区| 好吊色在线视频| 成人手机视频在线| 一区二区三区久久精品| 不卡av在线免费观看| 国产手机在线观看| 超碰97国产在线| 欧美午夜免费电影| 欧美在线 | 亚洲| 久久成人精品电影| 久久久一区二区三区捆绑**| 欧美少妇在线观看| 欧美一区二区三区啪啪| 亚洲国产精品一| 亚洲精品在线不卡| 久久精品国产亚洲高清剧情介绍| 在线免费黄色网| 国产精品极品美女在线观看免费| 亚洲三级理论片| 亚洲成熟少妇视频在线观看| 男人的天堂avav| 国产精品吹潮在线观看| 欧美日韩国产小视频| 久久九九电影| 久久国产精品无码一级毛片| 国产一区二区三区四区hd | 国产高潮呻吟久久| 黄色动漫在线免费看| 成人激情视频免费在线| 亚洲福利小视频| 亚洲天堂成人在线观看| 粉嫩av一区二区夜夜嗨| 色欲av无码一区二区三区| 永久免费网站视频在线观看| 国产精品在线看| 日韩精品在线私人| 欧美色视频日本高清在线观看| 日韩精品久久理论片| 欧美国产日韩在线观看成人| 成人日韩在线视频| 亚洲成人午夜在线| 欧美亚洲第一区| 日韩av在线最新| 亚洲观看高清完整版在线观看| 麻豆精品一区二区av白丝在线| 精品少妇theporn| 喷水视频在线观看| 99蜜桃臀久久久欧美精品网站| 国产精品最新在线观看| 精品国产一区二区三区四区四| 国产精品丝袜一区| 蜜桃av综合| 久久久久久不卡| 久久婷婷国产综合尤物精品| 久久久久99精品久久久久| 欧美不卡视频一区| 精品久久久久久久久久| 97国产精品videossex| 美女看a上一区| 日韩精品久久久久久| 国产免费叼嘿网站免费| 亚洲精品影院| 国产精品久久久久久久av大片| 久久国产精品电影| 日韩在线观看免费高清| 亚洲精品一区二三区不卡| 日韩一区二区三区观看| 色八戒一区二区三区| 免费成人av在线播放| 91热视频在线观看| 在线a免费观看| 日本黄色福利视频| 91丝袜超薄交口足| 日韩不卡的av| 欧美一级大片免费看| 日本网站在线看| 少妇欧美激情一区二区三区| 国产一级免费片| 蜜桃精品一区二区| 综合 欧美 亚洲日本| 日韩精品久久久久久久酒店| 九九九久久久久| 天堂中文字幕在线观看| 进去里视频在线观看| 亚洲图片小说视频| 婷婷在线观看视频| 韩国欧美一区二区| 豆国产96在线|亚洲| 久久综合狠狠综合久久综合88| 国产精品久久久久aaaa樱花| 天天色天天操综合| 欧美日韩亚洲视频一区| 欧美精品一区二区久久婷婷| 日韩av中文字幕在线| 中文字幕在线看视频国产欧美在线看完整| 国产成人av免费| 日韩无码精品一区二区三区| 精品人妻少妇AV无码专区| 看片的网站亚洲| 久久久久久影视| 欧美在线短视频| 久久色在线播放| 91精品视频网站| 最新不卡av| 国产真实乱人偷精品| 日本妇乱大交xxxxx| 久久69国产一区二区蜜臀| 最新成人av在线| 精品国产91洋老外米糕| 性欧美办公室18xxxxhd| 国产精品毛片va一区二区三区| 免费在线观看亚洲视频| 色欲狠狠躁天天躁无码中文字幕| 久久久久久久极品内射| 国产高清不卡视频| 国产精品免费人成网站| 亚洲国模精品私拍| 99免费在线观看视频| 中文字幕日韩综合| 日本在线视频免费| 国产一区二区三区蝌蚪| 亚洲成人免费视| 日韩在线观看精品| 中文字幕在线播放不卡一区| 最新不卡av在线| 欧美探花视频资源| 亚洲成人免费网站| 78m国产成人精品视频| 国产精品初高中精品久久| 十八禁视频网站在线观看| 青娱乐国产精品| 国产刺激高潮av| 亚洲一区二区精品视频| 亚洲性无码av在线| 超碰97在线资源| 交换做爰国语对白| 日韩黄色a级片| av影院午夜一区| 91精品国产91热久久久做人人| 97精品视频在线播放| 九九九九精品| 国产精品无码一区二区三区免费 | 日韩av在线免费观看| 日本免费一区二区三区| 日本高清www| 国产一区二区精品在线观看| 日韩精品福利网| 97久久超碰国产精品电影| 亚洲国产精品中文| 国产一区二区三区奇米久涩| 欧美性受xxxx黒人xyx性爽| 久久精品国产成人av| 久久男人中文字幕资源站| 日韩女优av电影| 国产精品美女久久久久av福利| 最近中文字幕无免费| 极品尤物av久久免费看| 精品精品国产高清一毛片一天堂| 国产伦精品一区二区三区视频免费| 99久久久久久久久久| 床上的激情91.| 久久精品99无色码中文字幕| 999精品网站| 久久一本综合频道| 精品视频一区二区不卡| 国产精品久久久久久婷婷天堂 | 国产aaa免费视频| 麻豆国产欧美一区二区三区| 久久天天躁日日躁| 91传媒理伦片在线观看| 久久久不卡网国产精品二区| 久久久久国产精品一区| 日韩高清一二三区| 久久一二三国产| 国产精品丝袜在线| 国产精品一区二区三区成人| 一区二区在线免费观看视频| 人妖欧美一区二区| 九九精品视频在线| 波多野结衣视频播放| 久久久精品影视| 国产精品一区二区久久国产| 91精品少妇一区二区三区蜜桃臀| 91毛片在线观看| 成人三级视频在线观看一区二区| aaa人片在线| 日韩欧美综合在线| 北条麻妃视频在线| 久久久精品天堂| 动漫一区二区在线| 国产日韩一级片| 日韩专区在线播放| 超碰91在线播放| 偷拍一区二区三区四区| 久久这里精品国产99丫e6| 日本黄色不卡视频| 久久免费精品视频| 亚欧视频在线观看| 色偷偷偷亚洲综合网另类| 国精产品一区二区三区| 欧美网站一区二区| 国产乱叫456| 午夜视频在线观看一区二区三区| 免费人成自慰网站| 国产日韩精品久久久| 日本在线高清视频一区| 国产精品影视网| 91精品久久久久久久久中文字幕 | 美日韩在线视频| www亚洲视频| 久久久久久com| 91在线公开视频| 日韩av电影手机在线观看| 在线观看国产小视频| 97国产suv精品一区二区62| 国产99久久久久久免费看| 国产97在线观看| 视频一区视频二区中文| 97久久天天综合色天天综合色hd | 国产三级av在线播放| 亚洲国产精品ⅴa在线观看| 丰满人妻一区二区三区53号| 国产一区二区不卡| 国产日韩欧美自拍| 午夜久久久久久噜噜噜噜| 久久精品一本久久99精品| 精品视频在线观看免费| 日韩国产欧美精品一区二区三区| 国产三级短视频| 国产亚洲免费的视频看| 欧美性生给视频| 亚洲精品久久久久中文字幕二区| 美女久久久久久久久| 欧美日韩国产一区| 先锋影音av在线| zzjj国产精品一区二区| 中文资源在线播放| 久久视频在线视频| 一区二区精品视频在线观看| 日本精品久久久久影院| 成人一级免费视频| 国产97免费视| 精品女同一区二区三区| 97se亚洲综合在线| 成人晚上爱看视频| 国产免费黄色av| 欧美怡红院视频| 日韩在线一卡二卡| 91精品国产高清久久久久久久久| 精品人妻一区二区三区三区四区 | 色综合伊人色综合网站| www.日本在线观看| 成人午夜av在线| 丝袜人妻一区二区三区| 欧美特黄级在线| 久久精品三级视频| 久久久久免费视频| 日韩激情av在线| 国产白丝袜美女久久久久| 在线精品亚洲一区二区不卡| 中文字幕狠狠干| 欧美亚洲国产视频| 久久综合久色欧美综合狠狠| 在线精品一区二区三区| 欧美精品情趣视频| 丁香婷婷综合激情五月色| 日韩av影视大全| 久久亚洲私人国产精品va| 狠狠久久亚洲欧美| 国产欧美精品一二三| 欧美成人精品在线视频| av电影在线观看一区| 一级黄色性视频| 成人综合电影| 一本大道av一区二区在线播放| 日韩不卡高清视频| www.69av| 色偷偷噜噜噜亚洲男人的天堂| 久久婷婷综合激情| 免费在线观看国产精品| 日本一区二区三区视频在线观看 | 55夜色66夜色国产精品视频| 亚洲欧美另类久久久精品| 欧美三级一区二区三区| 成人av播放| 欧美性高清videossexo| 日本黄色三级视频| 超碰成人在线播放| 国产精品成久久久久三级 | 亚洲第一福利在线观看| 久久久久久网| 亚洲第一页av| 国产精品久久久久久免费观看| 中文字幕一区二区三| 在线免费观看av网址| 日韩欧美猛交xxxxx无码| 中文欧美在线视频| 成人欧美一区二区三区视频网页| 免费av网站在线| 丰满少妇大力进入| 人九九综合九九宗合| 午夜精品影院在线观看| 中文字幕免费在线看| 日本男人操女人| 91免费福利视频| 精品对白一区国产伦| 成人福利电影精品一区二区在线观看| 日韩av网站在线播放| 久久婷婷中文字幕| 久久伊人91精品综合网站| 精品久久久精品| 99久久精品日本一区二区免费| 中文字幕一区二区在线观看视频| 天堂网成人在线|