色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

大模型檢測“指令沖突”能力新基準

上海交通大學王德泉課題組 投稿

量子位 | 公眾號 QbitAI

上海交通大學王德泉教授課題組在最新研究中提出了這樣的一個問題。

設想這樣一個場景:一個幼兒園的小朋友拿著一張老虎的圖片,向你詢問:“這個小貓很可愛,它是一只母貓么?”你會如何回答?

你可能并不會直接回答“是”或“不是”,而是首先指出這個提問中的“矛盾”所在——這張圖片是一只老虎,而不是貓。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

但關于大模型會怎樣應對,之前很少有系統性的研究。

要知道,無法檢測出“指令沖突”的AI模型會針對“不應該有答案的問題”生成結果,而無論生成的結果偏向于沖突的哪一方,都會引發潛在的災難,影響AI安全性以及Superalignment(超級對齊)。

在最新的這項研究中,團隊提出了多模態基準測試——自相矛盾指令集,并設計了一個創新的自動數據集創建框架,名為AutoCreate。

團隊發現多模態大模型對于自相矛盾的用戶指令的檢測非常欠缺,因此提出了認知喚醒提示方法(CAP),從外部世界注入認知能力從而提高了矛盾檢測的能力。

該論文即將發表在今年10月份的第18屆歐洲計算機視覺大會(ECCV)上。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

大模型能檢測到沖突指令嗎?

目前,多模態大模型在科研和應用領域取得了巨大的進展。它們能夠處理包括文本、圖像在內的多種數據類型,顯示出與人類認知相似的能力。

團隊認為這些模型的成功得益于大量的研究和開發工作,使它們能夠緊密遵循人類的指令,甚至有些“唯命是從”。

此外,這些模型還特別擅長于長上下文。多模態大模型如Claude 3和Gemini 1.5 Pro等,已經展示出強大的能力。Claude 3系列模型提供了200K tokens的上下文窗口,Gemini 1.5 Pro的標準上下文窗口大小為128K,甚至在私人預覽階段可以達到1M tokens。

這些進展使得多模態大模型在處理復雜任務方面表現出色,滿足了人類長時間互動的需求。

然而,隨著多模態交互的深入、上下文長度的增加,用戶指令自相矛盾的問題變得越來越突出。

如下圖,當用戶(如兒童或語言初學者)使用這些模型時,往往無法意識到潛在的多模態沖突。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

同時,隨著對話輪次的增加和上下文窗口的擴大,用戶難以記住所有細節,導致指令間的矛盾。

此外,隨著模態數量的增加,模態間的沖突也可能發生。一旦這些模型缺乏自我意識和辨別矛盾的能力,其性能就會受到影響。

為了應對這些挑戰,本文研究團隊提出了一個多模態基準測試——“自相矛盾指令集”(Self-Contradictory Instructions, SCI),用于評估多模態大模型檢測沖突指令的能力。

SCI包含2萬個沖突指令8個任務,均勻分布在語言-語言視覺-語言兩種范式中。

在圖中的上部分,語言-語言范式涉及上下文和指令之間的沖突,如設計的規則沖突、對象屬性沖突、排他性指令和禁止詞匯。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

在圖中的下部分:視覺-語言范式涵蓋多模態沖突,如OCR文字識別沖突、圖表沖突、幾何沖突和語義沖突。八個任務中,只有語義沖突涉及到了其他的數據集(ImageNet)。

舉一個具體的例子來說,在構建語義沖突時,研究人員會首先根據圖片生成對應的文本,隨后將文本中的關鍵語義信息替換成相近但是不同的新語義。

在下圖中,圖片中包含了鴕鳥(Ostrich),作者針對圖片語義“鴕鳥”添加問題“Does the picture depict the ostrich’s size?”。

隨后,再對這個問題文本的關鍵語義“鴕鳥”替換為“幾維鳥”(Kiwi)。這樣一來,一對自相矛盾的多模態指令就構建好了。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

在整個SCI的構建過程中,作者設計了創新的自動數據集創建框架——AutoCreate

它通過程序和大語言模型構建了一個多模態循環。該框架利用程序和大型語言模型來實現自動化的數據集創建。

AutoCreate從若干與任務相關的種子數據開始,并維護一個種子池。在每個周期內,AutoCreate包括兩個分支:語言分支(左)和視覺分支(右)。每個分支都由生成器和修飾器組成。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

最后,清理器將排除不符合標準的數據。這些數據在通過人工專家的質量檢查后,將被反饋到種子池中,供下一輪使用。

AutoCreate大大提升了SCI數據集的構建速度和內容廣度。

怎樣提高矛盾檢測能力?

通過SCI數據集,研究人員全面評估了大模型在處理矛盾指令時的表現。

實驗結果表明,當前的大模型在面對自相矛盾的指令時,常常表現出一定的不足。

它們能夠處理信息和知識,但缺乏對指令合理性的評估能力,研究團隊稱之為的“認知”能力。

這種缺陷源于缺乏自我意識,無法識別指令中的不一致性。

因此,研究人員提出了一種簡單的插入式提示方法,稱為“認知覺醒提示”(Cognitive Awakening Prompting, CAP)。

CAP通在輸入中加一句簡單的提示,就可以從外部世界注入認知能力,從而提高大模型的矛盾檢測能力,并且基本不會產生負面影響。

這一發現表明,當前多模態大模型需要更多的自我意識和認知能力,以便更好地處理復雜的指令沖突。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

更多細節,感興趣的童鞋可以查看原論文。

作者簡介

論文第一作者是上海交通大學博士研究生郜今。

他的研究方向包括計算機視覺、多模態大模型、人工智能賦能的生命科學等。

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密

論文的通訊作者為上海交通大學長聘教軌助理教授、博士生導師王德泉,他本科畢業于復旦大學,博士畢業于加州大學伯克利分校,師從 Trevor Darrell 教授。

他的研究工作發表在CVPR、ICCV、ECCV、ICLR、ICML、ICRA、IROS等國際頂級會議,近五年論文谷歌學術總引用次數10000余次,H-index 20。

論文鏈接:https://arxiv.org/abs/2408.01091
項目鏈接:https://selfcontradiction.github.io/

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
91国产一区在线| 国产伦精品一区二区| 日韩影院在线观看| 超级碰在线观看| 亚洲日韩中文字幕在线播放| 日韩二区三区四区| 91精品国产高清91久久久久久| 美日韩精品视频免费看| 欧美视频精品一区| 日韩jizzz| 亚洲老头老太hd| 色偷偷综合社区| 天堂网av手机版| 久久免费黄色| 国产精品免费视频xxxx| 欧美在线一区二区| 欧美视频日韩视频| 国产精品传媒视频| 18成人在线观看| 人妻无码中文字幕| 欧美精品电影免费在线观看| 97se亚洲国产综合自在线不卡| 欧美日韩小视频| 久久精品国产一区二区三区| 亚洲免费在线观看视频| 日韩二区三区四区| va视频在线观看| 无码人妻精品一区二区三区不卡 | 欧美国产亚洲一区| 人人干人人干人人干| 国产麻豆91视频| 国精产品乱码一区一区三区四区| 麻豆成人免费电影| 福利视频第一区| 欧美韩国一区二区| 中文字幕在线视频一区| 91av在线不卡| 亚洲爆乳无码专区| 国产一区免费看| 欧美高清在线视频| 丝袜a∨在线一区二区三区不卡| 亚洲人123区| 精品国产一区二区三区av性色 | www.色综合| 精品国产一区二区三区四区vr| 国产精品果冻传媒潘| 日韩视频一二三| 欧美熟妇精品黑人巨大一二三区| 在线xxxxx| 天天操天天摸天天干| 日韩av影院在线观看| 成人小视频免费在线观看| 色诱女教师一区二区三区| 99在线精品观看| 老司机免费视频久久| 国产成人久久精品77777综合 | 亚洲五月天综合| 草草视频在线免费观看| 97碰在线视频| 91精品一区二区三区四区| 亚洲成人自拍| 欧美精品七区| 亚洲一区二区三区乱码| 宅男av一区二区三区| 亚洲人久久久| 乱人伦xxxx国语对白| 国产性xxxx18免费观看视频| 992tv快乐视频| 波多野结衣作品集| 四虎永久国产精品| 在线无限看免费粉色视频| 国产九九精品视频| 亚洲免费精彩视频| 中文字幕欧美日韩精品| 国产亚洲人成网站在线观看| 亚洲一品av免费观看| 久久精品国产91精品亚洲| 日韩一级黄色av| 久久久久亚洲av成人毛片韩| 美国黄色特级片| 亚洲少妇xxx| 久草中文在线视频| 国产免费黄色大片| 影音先锋在线国产| 亚洲国产精品欧美久久| 国产专区欧美精品| 亚洲欧美日本在线| 日韩女优av电影| 中文字幕9999| 成人黄色免费在线观看| 在线免费观看成人| 777一区二区| 真实乱视频国产免费观看| 精品国产成人亚洲午夜福利| 五月天综合激情网| 国产精品777777| 国产专区综合网| 99久久精品免费看| 亚洲aaa精品| 中文精品99久久国产香蕉| 国产日韩欧美91| 国产树林野战在线播放| 在线精品亚洲一区二区| 亚洲精品视频一区二区三区| 免费激情视频在线观看| 国精产品久拍自产在线网站| 亚洲午夜在线播放| 91蜜桃传媒精品久久久一区二区| 成人h动漫精品| 欧美男人的天堂一二区| 欧美极品少妇xxxxⅹ喷水| 亚洲一区二区三区四区在线播放 | 免费的av网站| 色老头在线视频| caoporm超碰国产精品| 亚洲精品高清视频在线观看| 粉嫩av蜜桃av蜜臀av| 美国黑人一级大黄| 久久久久国产精品一区二区| 亚洲人123区| 正在播放亚洲1区| 国产国语videosex另类| 亚洲国产日韩欧美在线观看| 日韩av大片免费看| 国外成人性视频| 久久av综合网| 国产日韩欧美一区二区东京热| 久久女同互慰一区二区三区| 欧美性猛交xxxx黑人| 久久久久久久久久久免费精品| 精选一区二区三区四区五区| 国产 福利 在线| 久久中文字幕免费| 麻豆国产精品一区二区三区| 精品国产91亚洲一区二区三区婷婷| 精品午夜一区二区| 久久国产精品国语对白| 欧美国产成人精品| 欧美一级淫片videoshd| 亚洲图片 自拍偷拍| 亚洲国产精品无码久久久| 亚洲激情自拍视频| 午夜免费日韩视频| 欧美一级爱爱视频| 麻豆视频在线观看| 亚洲一区二区三区小说| 亚洲自拍欧美色图| 国产99久久久| 91精品国产一区二区三区| r级无码视频在线观看| 天堂在线观看视频| 久久av.com| 日韩va在线观看| 久久一区二区视频| 日韩精品一区二区三区视频在线观看 | 成人午夜av影视| 欧美性视频精品| 无码人妻丰满熟妇区毛片| 国产理论视频在线观看| 亚洲天堂成人在线视频| 国产精品探花在线播放| 五月婷婷在线观看视频| 亚洲男人天堂九九视频| 免费在线成人av| 国产免费无遮挡吸奶头视频| 亚洲男人的天堂av| 国内精品**久久毛片app| a级片免费观看| 欧美激情免费视频| 久久精品在线观看视频| 欧美日韩国产大片| 六月婷婷激情网| 国产999精品久久久久久绿帽| 日韩美女视频免费在线观看| ,一级淫片a看免费| 亚洲美女喷白浆| 国精产品一区一区| 亚洲欧美综合区自拍另类| 精品一区二区视频在线观看| 在线观看av一区| 可以在线看的av网站| 国产精品午夜久久| 成人免费毛片在线观看| 亚洲欧洲综合另类| 久久久久人妻精品一区三寸| 好吊色在线观看| 国产精品免费观看在线| 久久中文在线| 日韩三级电影免费观看| 久久久国际精品| 免费看黄色一级大片| 国产精品久久久久影院亚瑟| 91久久国产视频| 日韩欧美国产骚| 久久久久狠狠高潮亚洲精品| 国产女人18毛片水真多成人如厕 | 欧美午夜精品一区二区| 欧美性感一类影片在线播放| 91激情视频在线观看| 国产亚洲福利一区| 国产熟女精品视频| 国产精品播放| 91麻豆福利精品推荐| 国产成人精品一区二区在线 | 久久这里只有| 91网在线免费观看| 91亚洲精品国偷拍自产在线观看 | av 一区二区三区| 狠狠色伊人亚洲综合网站色| 精彩视频一区二区三区| 免费成人看片网址| 国产精品无遮挡| 人妻互换一二三区激情视频| 91精品国产色综合久久久蜜香臀| 一级一片免费看| 日韩欧美三级一区二区| 欧美日韩中文字幕一区二区| 波多野结衣视频播放| 日韩av中文字幕在线免费观看| 久久久久亚洲蜜桃| 中文字幕 91| 欧美国产日韩中文字幕在线| caoporn国产精品| 不卡影院一区二区| 久久好看免费视频| 北条麻妃69av| 亚洲综合无码一区二区| 精品一级少妇久久久久久久| 色姑娘综合av| 亚洲精品按摩视频| 先锋av资源站| 国产精品九九视频| 国产精品视频一区二区三区四| 亚洲夂夂婷婷色拍ww47| 久久成人在线观看| 日韩片电影在线免费观看| 亚洲国产日韩一区| 另类人妖一区二区av| 色天使在线视频| 99视频免费观看| 久久亚洲精品国产亚洲老地址| 精品久久久久中文慕人妻| av动漫在线看| 在线观看视频亚洲| 中文字幕免费一区| 一级片免费网站| 日韩av三级在线| 5278欧美一区二区三区| 亚洲已满18点击进入久久| 国产高清不卡视频| 日韩免费毛片视频| 97av视频在线| 欧美色视频在线| 亚洲成熟少妇视频在线观看| 黄色一级在线视频| 国产不卡av在线| 欧美日韩你懂得| 蜜臀久久99精品久久久| 亚洲国产精品影视| 欧美激情一区二区三区久久久 | 欧美激情在线观看| 中文字幕一区二区视频| 日本少妇毛茸茸高潮| 妞干网在线观看视频| 国产精品69久久| 亚洲视频在线观看视频| 亚洲精品国产成人久久av盗摄 | 99久久综合狠狠综合久久| 精品99在线观看| 久久久久无码精品| 欧美少妇在线观看| 96久久精品| 91精品国产乱码久久久久久久久 | 国产精品白嫩初高中害羞小美女| 欧美疯狂性受xxxxx喷水图片| 中国色在线观看另类| 日韩在线观看一区二区| 国产又粗又猛又爽又| 欧美三级午夜理伦三级| 国产精品久久视频| 欧美日韩另类在线| 91一区二区三区在线观看| 超碰免费在线97| 最新日韩免费视频| www.av中文字幕| 老汉色影院首页| 国产精品一区二区三区观看| 欧美一二三区在线观看| 亚洲视频资源在线| 日韩国产欧美在线观看| www国产在线| 日本中文字幕久久| 国产成人亚洲欧洲在线| 国产美女高潮视频| 国产三级精品三级观看| 亚洲高清av一区二区三区| 可以在线看的av网站| 日韩欧美亚洲精品| 国产精品扒开腿做爽爽爽视频 | 欧美人xxxx| 亚洲成人激情自拍| 亚洲电影在线免费观看| 亚洲国产小视频| 国产成人高潮免费观看精品| 一区二区亚洲欧洲国产日韩| 亚洲国产日日夜夜| 亚洲综合丁香婷婷六月香| 久久久影院官网| 亚洲精品欧美激情| 欧美日韩精品三区| 日韩一区二区三区视频| 欧美视频免费在线| 欧美精品一级二级| 亚洲网址你懂得| 欧美极品少妇与黑人| 欧美激情亚洲自拍| 国产日韩精品视频| 9a蜜桃久久久久久免费| 视频二区一区| 日韩精品久久一区二区| 久久视频这里有精品| xxxxxx黄色| 国产精品无码久久av| 大美女一区二区三区| 国产网站一区二区| 欧美精品亚洲二区| 九九热最新视频//这里只有精品| 欧美另类交人妖| 免费看成人午夜电影| 17c丨国产丨精品视频| 国内av一区二区| 91高清免费看| 久久国产主播| 亚洲欧美日韩电影| 色视频成人在线观看免| 亚洲男女性事视频| 99在线视频首页| aaa毛片在线观看| 国产传媒国产传媒| 老司机精品久久| 国产日韩精品久久久| 日韩免费在线观看| 国产精品一区在线观看| 一区二区三区四区毛片| 极品国产91在线网站| 国产sm精品调教视频网站| 亚洲高清免费在线| 日韩在线观看高清| 国产精选一区二区| 国产成人黄色网址| 超碰在线播放97| 99天天综合性| 日本韩国欧美在线| 久久久久久尹人网香蕉| 亚洲小视频在线播放| 久久久久久久福利| 亚洲色图欧洲色图| 午夜精品久久久久久久99黑人| 久久久久久久久久久福利| 亚洲精品视频在线观看免费视频| av电影在线观看不卡| 亚洲天堂精品在线| 中文字幕久久综合| 久久视频一区二区三区| 久久精品系列| 日本道精品一区二区三区| 国产精品一区二区欧美黑人喷潮水| av污在线观看| 亚洲 精品 综合 精品 自拍| 欧美日韩精品福利| 亚洲欧美日韩另类精品一区二区三区| 女教师淫辱の教室蜜臀av软件| 国产三级一区二区| 久久久久久久久久婷婷| 国产肥臀一区二区福利视频| 国产一级免费视频| 69堂亚洲精品首页| 女人被男人躁得好爽免费视频 | 欧美日韩国产三级| 9色porny| 亚洲av无码片一区二区三区| 在线免费观看不卡av| 国新精品乱码一区二区三区18| 在线观看日韩精品视频| 亚洲欧洲精品一区二区精品久久久| 91久热免费在线视频| 黄色一级片免费在线观看| 欧美午夜精品久久久久久孕妇| 久久久国产精品一区二区三区| 成人毛片一区二区三区| 精品日韩一区二区| 蜜桃视频无码区在线观看| 国产成人精品亚洲午夜麻豆| 欧美影院久久久| 精品人妻一区二区三区潮喷在线| 精品久久久久久久久久久久久久 | 99久久精品免费视频| 午夜国产不卡在线观看视频| www国产免费| av电影一区二区| 欧美极品美女电影一区| 亚洲国产果冻传媒av在线观看| 一区二区三区资源| 中国丰满熟妇xxxx性| 国产一区视频网站| 91福利视频网| 国产精品久久久久久久成人午夜| 亚洲第一在线视频| 9.1成人看片| 日韩欧美在线中文字幕|