Claude翻車：Opus 4.1白天退化，Anthropic承認并回滾更新

聞樂 2025-09-01 17:19:34 來源：量子位

網友：第一次見明星公司解釋模型質量下滑

聞樂發自凹非寺

量子位 | 公眾號 QbitAI

發布即拿下各項SOTA的Claude Opus 4.1，也翻車了。

不止一位用戶反饋Claude Opus 4.1變得遲鈍，于是把官方炸出來承認：Claude Opus 4.1在處理某些請求時確實出現了質量退化。

Claude Opus 4.1到底出現了什么問題？

Claude Opus 4.1白天推理性能下降

實際上，在Anthropic發聲明的前幾天就有用戶發帖表示：Claude Opus 4.1在上午10點到11點這段時間性能非常差。

模型經常像變了個人，在完成處理文稿任務時總是出現很多錯誤。但是這種質量下滑卻在凌晨時消失。

有人猜測，導致這一現象的原因可能是Claude Opus 4.1白天采用1.58位量化。

這種方式的首要問題在于對模型精度影響較大。

量化本質是將模型參數從標準的16位浮點（FP16）或32位浮點（FP32）降低到低位格式，1.58位量化更是極端，僅用 {-1, 0, 1} 三個值來表示參數。

由于在信息論中，三個可能的值需要log?(3)≈1.58496 bits來表示，這種量化方式也因此得名。

然而，這樣雖然減少了內存使用，卻很容易讓模型丟失關鍵信息。

就像在Claude Opus 4.1中，如果白天使用1.58 位量化為大量用戶服務，模型在處理復雜問題時，智能水平就會明顯下滑，代碼邏輯分析出錯、文案撰寫邏輯混亂，連常規任務表現也不盡人意。

在實際應用中，1.58位量化還可能導致模型穩定性欠佳。當模型參數被強制限定在有限的三個值時，面對復雜多變的輸入數據，它的應對能力就會受到制約。

在一些需要對輸入數據進行精準處理的場景下，例如醫學圖像分析、金融風險預測等，模型可能因1.58位量化無法準確捕捉數據特征，給出錯誤結果，進而影響整個系統的穩定性和可靠性。

除了白天性能下降的問題，在使用限制方面，官方的回應也并不明確。

用戶反映有一次使用Claude Opus 4.1不到兩小時，就已經達到了使用上限。去詢問客服時，得到的反饋一會兒是由于使用時長限制，一會兒又說是使用量。

并且，限額的問題也不止一位用戶反映。

甚至有用戶反映該模型還會暴露API密鑰。

面對這么多吐槽，好在Anthropic官方沒讓人等太久，出來回應了。

直接承認是推理堆棧出了問題，本來是想提升模型效率，結果沒想到影響了響應質量。（沒找借口，態度倒是挺實在）

而且解決速度也快已經把Claude Opus 4.1的版本回滾了，還特意提了Claude Opus 4.0也受了同樣影響，正在處理，算是把問題考慮周全了。

聲明一發，有網友調侃稱還是第一次看到“明星公司”承認模型出了問題。

看來Anthropic良好的認錯態度還是被廣大網友接受了。

不過話說回來，Claude的用戶們，你們最近有沒有察覺Opus 4.1的質量下滑呢？

參考鏈接：
[1]https://x.com/TheAhmadOsman/status/1961870729609175088
[2]https://status.anthropic.com/incidents/h26lykctfnsz
[3]https://www.reddit.com/r/Anthropic/comments/1n28ya2/claude_opus_is_all_over_the_place_lately_and_i/

— 完 —

聞樂

又一高管棄庫克而去！蘋果UI設計負責人轉投Meta2025-12-04
萬卡集群要上天？中國硬核企業打造太空超算！2025-11-29
學生3年投稿6次被拒，于是吳恩達親手搓了個評審Agent2025-11-25
波士頓動力前CTO加盟DeepMind，Gemini要做機器人界的安卓2025-11-25

Claude翻車：Opus 4.1白天退化，Anthropic承認并回滾更新

Claude Opus 4.1白天推理性能下降

相關閱讀

Claude團隊引眾怒，為爬數據不擇手段，給爬蟲改名字無視禁止規則

AI也邪修！Qwen3改Bug測試直接搜GitHub，太擬人了

最強編碼模型Claude 4！7小時不間斷寫代碼，連玩24小時寶可夢，GitHub已選為Copilot底層模型

硅谷掀桌！DeepSeek遭OpenAI和Anthropic圍剿，美國網友都看不下去了

Claude團隊喜提清華物理學霸姚順宇！兩個Yao Shunyu都投身大模型了

Claude編程支持一鍵共享，第一批網友已經開始曬作品了

熱門文章

DeepSeek-V3.2系列開源，性能直接對標Gemini-3.0-Pro

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

前端沒死，AI APP正在返祖

寧德時代給9萬+基層員工漲了薪！每月150元

Claude翻車：Opus 4.1白天退化，Anthropic承認并回滾更新

Claude Opus 4.1白天推理性能下降

相關閱讀

Claude團隊引眾怒，為爬數據不擇手段，給爬蟲改名字無視禁止規則

AI也邪修！Qwen3改Bug測試直接搜GitHub，太擬人了

最強編碼模型Claude 4！7小時不間斷寫代碼，連玩24小時寶可夢，GitHub已選為Copilot底層模型

硅谷掀桌！DeepSeek遭OpenAI和Anthropic圍剿，美國網友都看不下去了

Claude團隊喜提清華物理學霸姚順宇！兩個Yao Shunyu都投身大模型了

Claude編程支持一鍵共享，第一批網友已經開始曬作品了

熱門文章

DeepSeek-V3.2系列開源，性能直接對標Gemini-3.0-Pro

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創 語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

前端沒死，AI APP正在返祖

寧德時代給9萬+基層員工漲了薪！每月150元

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式