Claude翻車:Opus 4.1白天退化,Anthropic承認并回滾更新
網友:第一次見明星公司解釋模型質量下滑
聞樂 發自 凹非寺
量子位 | 公眾號 QbitAI
發布即拿下各項SOTA的Claude Opus 4.1,也翻車了。
不止一位用戶反饋Claude Opus 4.1變得遲鈍,于是把官方炸出來承認:Claude Opus 4.1在處理某些請求時確實出現了質量退化。

Claude Opus 4.1到底出現了什么問題?
Claude Opus 4.1白天推理性能下降
實際上,在Anthropic發聲明的前幾天就有用戶發帖表示:Claude Opus 4.1在上午10點到11點這段時間性能非常差。
模型經常像變了個人,在完成處理文稿任務時總是出現很多錯誤。但是這種質量下滑卻在凌晨時消失。

有人猜測,導致這一現象的原因可能是Claude Opus 4.1白天采用1.58位量化。
這種方式的首要問題在于對模型精度影響較大。
量化本質是將模型參數從標準的16位浮點(FP16)或32位浮點(FP32)降低到低位格式,1.58位量化更是極端,僅用 {-1, 0, 1} 三個值來表示參數。
由于在信息論中,三個可能的值需要log?(3)≈1.58496 bits來表示,這種量化方式也因此得名。
然而,這樣雖然減少了內存使用,卻很容易讓模型丟失關鍵信息。
就像在Claude Opus 4.1中,如果白天使用1.58 位量化為大量用戶服務,模型在處理復雜問題時,智能水平就會明顯下滑,代碼邏輯分析出錯、文案撰寫邏輯混亂,連常規任務表現也不盡人意。
在實際應用中,1.58位量化還可能導致模型穩定性欠佳。當模型參數被強制限定在有限的三個值時,面對復雜多變的輸入數據,它的應對能力就會受到制約。
在一些需要對輸入數據進行精準處理的場景下,例如醫學圖像分析、金融風險預測等,模型可能因1.58位量化無法準確捕捉數據特征,給出錯誤結果,進而影響整個系統的穩定性和可靠性。
除了白天性能下降的問題,在使用限制方面,官方的回應也并不明確。
用戶反映有一次使用Claude Opus 4.1不到兩小時,就已經達到了使用上限。去詢問客服時,得到的反饋一會兒是由于使用時長限制,一會兒又說是使用量。

并且,限額的問題也不止一位用戶反映。

甚至有用戶反映該模型還會暴露API密鑰。

面對這么多吐槽,好在Anthropic官方沒讓人等太久,出來回應了。
直接承認是推理堆棧出了問題,本來是想提升模型效率,結果沒想到影響了響應質量。(沒找借口,態度倒是挺實在)
而且解決速度也快已經把Claude Opus 4.1的版本回滾了,還特意提了Claude Opus 4.0也受了同樣影響,正在處理,算是把問題考慮周全了。

聲明一發,有網友調侃稱還是第一次看到“明星公司”承認模型出了問題。

看來Anthropic良好的認錯態度還是被廣大網友接受了。
不過話說回來,Claude的用戶們,你們最近有沒有察覺Opus 4.1的質量下滑呢?
參考鏈接:
[1]https://x.com/TheAhmadOsman/status/1961870729609175088
[2]https://status.anthropic.com/incidents/h26lykctfnsz
[3]https://www.reddit.com/r/Anthropic/comments/1n28ya2/claude_opus_is_all_over_the_place_lately_and_i/
— 完 —
- 又一高管棄庫克而去!蘋果UI設計負責人轉投Meta2025-12-04
- 萬卡集群要上天?中國硬核企業打造太空超算!2025-11-29
- 學生3年投稿6次被拒,于是吳恩達親手搓了個評審Agent2025-11-25
- 波士頓動力前CTO加盟DeepMind,Gemini要做機器人界的安卓2025-11-25




