色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

還創造出不存在的物理學理論

聞樂 發自 凹非寺

量子位 | 公眾號 QbitAI

GPT-oss放飛自我了?!居然出現了明顯的幻覺行為。

在沒有提示詞的情況下,消耗超過30000個token憑空想出一個問題,還反復求解了5000多次?!

這是個關于多米諾骨牌的編程問題,簡單來說就是:在NxM的網格中先放一個多米諾占掉兩個相鄰的自由格,剩下的自由格必須剛好能拼成多個2×2的方塊。

然后就開始自行暴力求解……

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

最近,有人好奇GPT-oss的訓練數據構成情況如何,所以就進行了一系列測試。

結果發現了一堆GPT-oss的奇怪問題,比如還有:

  • 創造不存在的物理學理論
  • 拒絕談論生活瑣事
  • ……

這到底怎么一回事?

GPT-oss熱衷于推理,推理過程中時常伴隨語言轉換

事情是這樣的,有網友對GPT-oss-20b生成的1000萬個示例進行了一些分析,結果發現該模型的一些行為非常古怪。

下圖是作者使用分類器分析模型掌握編程語言的情況,可以看出該模型的訓練數據覆蓋了幾乎所有常見編程語言,其中Perl的占比尤其高。

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

這說明GPT-oss的訓練數據很廣泛,然而作者據自身經驗提出質疑:認為Java和Kotlin的實際占比應該高得多。

而這張關于模型生成內容分布的示意圖顯示,該模型非常熱衷于數學和代碼領域,即使不需要任何推理,也會主動進行推理,并且生產的內容幾乎都圍繞著數學,且大多用英語表達。

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

并且該模型生成的內容既不像自然網頁文本(如日常文章、論壇帖子等偏生活化、隨意性的文本),也不同于普通聊天機器人的交互內容(如對話式回應、問答互動)。

于是作者據此推斷,該模型并不是為了模擬自然語言或日常對話設計的,而是通過強化學習專門訓練,目的是在特定的推理任務基準上進行思考和解題。

更有細心的網友發現下圖這種情況的出現可能是由于在訓練中對特定方向清除了一大片訓練權重。

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

作者基于平均頻率對token進行采樣,并用單個token作為提示讓模型生成內容。

這時模型會幻覺式生成多米諾骨牌的編程問題,并自發嘗試解決,單次過程就消耗了超過30000個token(相當于數萬字的文本量)。

問題是:在NxM的網格中,先放置1個2格骨牌,占掉2個相鄰自由格,然后看剩下的自由格能不能剛好切成多個不重復的2×2方塊(4格),要找出所有滿足這個條件的骨牌擺法。

然后GPT-oss-20b就開始暴力求解了。

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

更特殊的是,在基本沒有提示的情況下,這種求解的行為重復發生了5000多次,這說明該任務可能與模型的訓練目標深度綁定。

這種極端重復且無提示生成的行為,反映出模型可能在訓練中被過度優化于特定推理任務,導致生成內容缺乏自然性,更像一個被訓練偏科的工具。

除此之外,作者還發現模型在推理過程中常常伴隨著語言轉換

許多推理鏈起初以英語展開,但會逐漸演變為一種被稱為“Neuralese”(可理解為模型特有的、非自然語言的神經層面表達)的狀態。

這些推理鏈會在阿拉伯語、俄語、泰語、韓語、中文和烏克蘭語等多種語言間自如切換,之后通常會轉回英語(但并非絕對)。

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

這一現象反映出模型在長文本生成或深度推理時,可能出現語言分布偏移,既包含自然語言間的交替,也存在向非自然語言表達的轉變。這暗示了模型可能在訓練數據特性或模型內部處理機制方面非常復雜。

模型輸出中還出現了特殊偽影(如“OCRV ROOT”)。

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

作者推測:這些異常符號或表述可能源于訓練數據的處理方式—— OpenAI在訓練過程中使用了OCR(光學字符識別)技術掃描書籍。

而OCR識別過程中可能出現錯誤或殘留痕跡(如“OCRV ROOT”這類可能的識別偏差),從而導致模型輸出中夾雜此類異常內容。

并且作者還表示:模型總愛提馬來西亞的聾人數量。

這種看似無關聯的內容,或許正是OCR掃描書籍時誤讀、漏讀,或訓練數據中特定文本片段被錯誤收錄的結果,這也進一步支撐了他“訓練數據經OCR處理且存在瑕疵”的猜想。

值得一提的是,在眾多異常表現中,模型也有少量創意輸出,比如為挪威劇本撰寫草稿。

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

并且展現出對unicode的熟練使用,但模型在物理領域的表現卻不盡如人意。

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

作者現已將分析使用的相關數據放在Hugging Facce上,可供感興趣人員進行研究使用。

同時他也給出了一些分析建議:

一是對模型高度冗余的輸出進行去重處理,以提高信息的有效性;

二是用自然語言描述不同文本分布的差異,例如對比不同規模模型(如20b與120b模型、LLAMA、GPT-5 等)的輸出情況,從而更深入地理解模型的運行機制。

GPT-oss的幻覺率高

實際上,最近不少人都覺得GPT-oss的幻覺情況比較嚴重。

OpenAI官方公布的數據已經顯示,GPT-oss-120b和GPT-oss-20b在基準測試PersonQA中的幻覺率分別達到了49%53%

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

在實際使用和測試中,模型可能出現的問題包括:

GPT-oss-20b花費了2個小時推理“生成一個水平、垂直和對角線都組成單詞的3×3字母矩陣”這個問題。就像一只被困在迷宮中的蒼蠅,無法停止推理但卻迷失了方向……

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

又比如GPT-oss-20b創造不存在的理論名稱:

請解釋“量子重力波動理論”在現代物理學中的應用。

實際上并不存在這個理論,僅有“量子引力理論”或“引力波理論”。但GPT-oss-20b還一本正經地說這是一個新興交叉學科……

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

還有人說在和它談論日常生活的瑣事時,它偶爾會拒絕談論,而有的時候會完全崩潰——

用占位符字符刪除整個段落。這讓它在除數學或者編程外的日常任務中顯得很沒用。

GPT-oss太離譜:無提示自行想象編程問題,還重復求解5000次

emmm……不知道你在使用過程中有遇到類似問題嗎?歡迎評論區討論~

相關數據:https://huggingface.co/datasets/jxm/GPT-oss20b-samples

參考鏈接:
[1]https://x.com/jxmnop/status/1953899426075816164
[2]https://news.ycombinator.com/item?id=44850260
[3]https://x.com/ViepliveeLee/status/1953982402231222763
[4]https://blog.csdn.net/weixin_66401877/article/details/150019363

— 完 —

版權所有,未經授權不得以任何形式轉載及使用,違者必究。
久久色在线观看| 日本中文字幕精品—区二区| 久久爱另类一区二区小说| 无码精品a∨在线观看中文| 中文日韩电影网站| 一区二区在线电影| 成人爱爱电影网址| 成人aaaa免费全部观看| 亚洲精品一级片| 国产探花在线观看视频| 久久国产精品免费视频| 99国产精品国产精品毛片| 在线精品一区二区三区| 精品国产乱码久久久久软件| 一区二区三区日本| 亚洲 中文字幕 日韩 无码| 欧美mv日韩mv| 国产精品白丝喷水在线观看| 95av在线视频| 在线一区二区三区四区| 一级成人免费视频| 久久久国产精品视频| 在线免费观看日韩欧美| 成人午夜av电影| 久久99久久99精品| 国产精品国产精品国产专区蜜臀ah| 成人乱人伦精品视频在线观看| 日韩精品在线观看一区| 亚洲成人午夜影院| 日本美女视频网站| 欧美一乱一性一交一视频| 亚洲毛片av在线| 少妇光屁股影院| 日韩手机在线导航| 色啦啦av综合| 中文字幕亚洲一区二区三区五十路| 国产三级欧美三级日产三级99| 欧美黄片一区二区三区| 在线免费观看一区二区三区| 91视频国产资源| 一级特黄aa大片| 欧美大片xxxx| 中文字幕 欧美 日韩| 五月激情婷婷在线| 亚洲看片网站| 亚洲欧美中文日韩v在线观看| 91免费小视频| 国产主播第一页| 色狠狠久久av五月综合| 日本新janpanese乱熟| 91福利视频导航| 亚洲一区二区三区xxx视频| 亚洲色无码播放| 五月天国产精品| 国产精品女同一区二区| 日日摸天天爽天天爽视频| 欧美日韩精品免费观看| 国产二区不卡| 欧美精品第三页| 国产精品福利导航| 欧美第一页在线观看| 日本视频在线免费| 人妻少妇精品无码专区二区| 日韩精品影音先锋| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 欧美sm美女调教| 久久66热re国产| 91高清国产视频| 成年女人18级毛片毛片免费| 久久久久久免费看| 97国产精品视频| 亚洲欧洲在线播放| 欧美欧美午夜aⅴ在线观看| 青娱乐免费在线视频| 国产一级大片在线观看| 国产一级黄色av| 国产成人无码www免费视频播放| 粉嫩欧美一区二区三区高清影视| 69亚洲精品久久久蜜桃小说| 韩国v欧美v日本v亚洲v| 激情偷乱视频一区二区三区| 欧美精品二区三区| 男人的天堂官网| 特级黄色片视频| 亚洲美女爱爱视频| 美女性感视频久久久| 欧美日韩亚洲91| 日韩中文字幕在线视频播放| 亚洲美女激情视频| 91麻豆福利精品推荐| 久久蜜桃精品| 97色在线视频| 91成人免费电影| 欧美肥妇毛茸茸| 精品一区二区三区三区| 国产在线精品一区免费香蕉| 日韩中文字幕a| 九九热最新地址| 91精品91久久久中77777老牛| 91九色国产ts另类人妖| 色之综合天天综合色天天棕色 | 五月婷婷一区| 日本亚洲欧洲色α| 亚洲午夜久久久久久久| 精品激情国产视频| 国产精品丝袜白浆摸在线| 69影院欧美专区视频| 激情久久久久久久久久久久久久久久 | 亚洲国内精品在线| 亚洲欧美国产va在线影院| 精品综合久久久久久97| 国产成人精品免费看在线播放 | 欧美成人艳星乳罩| 欧美高清一级大片| 国产高清精品一区二区| 国产欧美欧洲| 欧美成ee人免费视频| 国产经典一区二区三区| 成人一级生活片| 国产欧美一区二区三区久久人妖| 亚洲第一中文字幕| 18精品爽视频在线观看| 在线视频不卡一区二区三区| 超碰影院在线观看| www.久久国产| 性生交大片免费看l| 中文字幕在线有码| 日韩激情一区二区| 色综合久久88色综合天天免费| 欧美精品午夜视频| 在线观看免费污视频| 日本一区二区不卡在线| hitomi一区二区三区精品| 日韩欧美综合在线视频| 日韩欧美国产成人一区二区| 亚洲天堂男人天堂| 操日韩av在线电影| 日韩美女视频一区二区| 亚洲精品午夜久久久久久久| 精品久久久免费视频| 亚洲男人都懂的| 3d成人动漫网站| 欧美在线视频网| 91免费版看片| 欧美亚洲另类在线一区二区三区| 亚洲国产精品久久久久婷婷老年 | 久久久久久亚洲av无码专区| 国产精品初高中害羞小美女文| 青青久久aⅴ北条麻妃| 久久精品ww人人做人人爽| 欧美亚洲另类色图| www.中文字幕av| 亚洲国产精品suv| 伊人开心综合网| 日韩欧美精品网站| 69av一区二区三区| 久久精品电影一区二区| 国产一线二线三线在线观看| 欧美日韩生活片| 欧美日韩大片在线观看| 高清成人在线观看| 国产精品18久久久久| 国产情人综合久久777777| 精品国产自在久精品国产| 成人亚洲综合色就1024| 蜜桃久久精品成人无码av| 亚洲国产综合色| 国产视频在线观看一区| 日本天堂中文字幕| 夜夜嗨av一区二区三区网页| 亚洲区中文字幕| 91产国在线观看动作片喷水| 国产手机免费视频| 五月天精品在线| 日韩电影免费一区| 黄色小说综合网站| 亚洲精品视频一区二区| 久久久噜噜噜久久中文字免| 老司机午夜性大片| 人人干人人干人人干| 日韩av不卡在线观看| 麻豆精品视频在线观看视频| 色老综合老女人久久久| 欧美日韩日本国产| 欧美极品少妇xxxxx| 成人一级片网站| ,一级淫片a看免费| 欧美精品在线视频| 成人网页在线免费观看| 欧美精品久久久久久久免费| 一区二区三区四区影院| www.色日本| 精品女人久久久| 黄色免费视频大全| 久久精品国产亚洲av久| 国产精品一二三四五| 在线日韩第一页| 9色视频在线观看| 精国产品一区二区三区a片| 欧美韩国日本不卡| 亚洲日本成人在线观看| 97超级在线观看免费高清完整版电视剧| 色悠悠在线视频| 综合色天天鬼久久鬼色| 欧美久久久久久| 成人国产精品免费| 亚洲啪啪av| 99热这里只有精品5| 亚洲毛片在线观看| 一区二区三区四区欧美日韩| 亚洲天堂视频一区| 中文在线资源观看网站视频免费不卡 | 亚洲 小说区 图片区 都市| 国产视频在线观看一区二区| 免费激情视频在线观看| 懂色av成人一区二区三区| 欧美日韩1区2区| 亚洲精品一区二区三区樱花| 黄色av网址在线观看| 国产免费黄色大片| 亚洲精品美女免费| 99精品999| 亚洲一区二区成人在线观看| 国产精品裸体瑜伽视频| 综合久久综合久久| 亚洲欧美国产日韩中文字幕| 亚洲av成人片色在线观看高潮| 中文字幕一区二区三区色视频| 国产男女猛烈无遮挡91| 俄罗斯女人裸体性做爰| 精品福利影视| 中文字幕 视频一区| 日韩欧美一二三区| 国产日韩精品久久| 欧美人与禽zoz0善交| 国产69精品久久777的优势| 精品一区二区三区视频日产| 成人精品免费在线观看| 欧美性色黄大片| 国产99久久九九精品无码| 国产女无套免费视频| 亚洲男人天堂av| 日本欧美色综合网站免费| 精品国产999久久久免费| 久热精品视频在线免费观看| 日韩在线一卡二卡| 日韩欧美视频一区| 精品国产av色一区二区深夜久久 | 欧美性猛交xxxx乱大交少妇| 久久精品亚洲国产奇米99| 欧美午夜在线观看| 欧美精品一区在线发布| 小泽玛利亚一区二区免费| 中文字幕不卡av| 亚洲GV成人无码久久精品| 亚洲毛片在线观看.| 成年人三级黄色片| 嫩草影院一区二区三区| 亚洲风情在线资源站| 国产精品一区二区欧美| 性生活一级大片| 欧美一区1区三区3区公司| 国产欧美在线观看一区| 成人免费在线网| 99精品一区二区三区| 亚洲一区二区精品在线| 亚洲乱码日产精品bd| 成年人网站国产| 不卡免费追剧大全电视剧网站| 97视频在线观看免费高清完整版在线观看| 一区二区三区久久久久| 91精品国产综合久久精品| 天堂va欧美va亚洲va老司机| 国产三级精品视频| 国产91热爆ts人妖在线| 麻豆亚洲av成人无码久久精品| 亚洲精品永久免费| 中文字幕在线网址| 日本人成精品视频在线| 精品国产18久久久久久| 琪琪第一精品导航| 亚洲第一黄色片| 欧美一级在线观看| 阿v天堂2017| 欧美日韩色婷婷| 日本xxxx裸体xxxx| 久久久久久久久久久久久久久久久久av | 今天免费高清在线观看国语| 久久99精品国产.久久久久| 国产日本欧美一区二区三区| 亚洲a视频在线观看| 久久久久这里只有精品| 无码无套少妇毛多18pxxxx| 久久久视频精品| 国产乡下妇女做爰毛片| 一本一本久久a久久精品牛牛影视 一本色道久久综合亚洲精品小说 一本色道久久综合狠狠躁篇怎么玩 | 国产精品一区二区三区网站| 一区二区在线观看网站| 欧美亚洲免费在线一区| theporn国产精品| 欧美日韩一区小说| 国产美女福利视频| 日韩av手机在线观看| 国产高潮流白浆| 欧美日韩久久不卡| 久久成人国产精品入口| 99久在线精品99re8热| 中文字幕日本精品| 在线观看色网站| 麻豆国产精品va在线观看不卡| 免费看91的网站| 国产成人97精品免费看片| 亚洲精品乱码久久久久久日本蜜臀| 亚洲va在线观看| 日韩亚洲视频在线| 欧美一区二区三区免费观看视频| 日本中文字幕网| 亚洲视频综合网| 国产精品视频无码| 国产suv精品一区二区三区88区| 成人av资源在线观看| 国产裸体免费无遮挡| 69堂成人精品免费视频| 精品国产乱码一区二区三 | 国产精品99久久不卡二区| 中文字幕乱妇无码av在线| 久久久久久久久国产| 国产乱码精品一区二区三区日韩精品 | 九色porny91| 在线看日韩av| 亚洲黄色性网站| 免费观看的毛片| 特一级黄色录像| 91黄色小网站| 国产精品91在线观看| 亚洲国产成人porn| 中文字幕一区二区三区波野结| 日本一区二区三区视频在线观看| 精品久久久网站| 亚洲熟女www一区二区三区| 亚洲欧洲精品在线观看| 欧美变态tickle挠乳网站| 97人妻精品一区二区三区视频 | 99久久久无码国产精品免费蜜柚| 欧美视频第一区| 国内精品美女av在线播放| av一二三不卡影片| 手机在线播放av| 国产精品第二页| 色就色 综合激情| 亚洲熟女乱色一区二区三区久久久| 久久久久国产精品一区| 国产精品久久久久久久久果冻传媒| 欧美三级小视频| 欧美日韩午夜爽爽| 久久久久久久久久久国产| 亚洲成人午夜影院| 久久精品国产免费| 在线影院国内精品| 国产呦精品一区二区三区网站 | 国产亚洲精品aa| 538精品在线观看| 黄色一级片av| 中文字幕久热精品视频在线| 亚洲视频每日更新| 日本中文在线视频| 日韩av电影免费播放| 欧美大片在线观看一区二区| 国产精品一区在线观看乱码| 在线观看黄网站| 青青草视频播放| 国产伦精品一区二区三区照片91| 精品久久99ma| 99精品黄色片免费大全| av首页在线观看| 一二三av在线| 神马久久久久久| 亚洲久草在线视频| 人妻精品一区一区三区蜜桃91| 免费观看a级片| 手机看片福利日韩| 欧美日韩在线中文| 日本午夜精品电影| 久久久久久国产精品一区 | 粉嫩av免费一区二区三区| 91天堂在线视频| 欧美成人精品在线观看| 偷偷要91色婷婷| 国产成人一区在线| 精品国产伦一区二区三| 三年中国国语在线播放免费| 97超碰人人模人人爽人人看| 在线精品高清中文字幕| 亚洲国产精品精华液网站| 极品美女销魂一区二区三区| 自拍视频一区二区| 鲁鲁狠狠狠7777一区二区| 久久精品99久久久香蕉| 欧美色爱综合网| 精品成人久久av| 91免费在线看| 麻豆精品视频在线观看| 亚洲欧美卡通动漫| av动漫在线观看| 国产精品乱码| 六月丁香婷婷色狠狠久久| 欧美丰满美乳xxⅹ高潮www| 亚州av一区二区| 欧美成人欧美edvon| 亚洲欧美日韩久久|