谷歌AI獲IMO“唯一金牌”,硅谷夾道祝賀,奧特曼丟人又丟人
馬斯克發推祝賀
克雷西 發自 凹非寺
量子位 | 公眾號 QbitAI
谷歌Gemini拿下了IMO金牌,而且是官方認證的那種。
經過IMO官方裁判評分,Gemini新模型答對了6道題中的5道,以35分的成績斬獲金牌。

斬獲金牌的是Gemini的一個進階版本,搭載了新的思考模式,后期會開放給Google AI Ultra訂閱用戶——也就月付1400元那種。
去年三天摘銀,今年4.5小時奪金,DeepMind的數學成績可以說是突飛猛進。
除了DeepMind CEO哈薩比斯、谷歌CEO劈柴哥給團隊發來賀電,馬斯克也發推表示了祝賀。

DeepMind這波可謂是被各界夾道祝賀,做得體面又周到。
但DeepMind被夸得越好,OpenAI就越發相形見絀,同樣是AI參賽IMO,秘密搞事情也就算了,還為了營銷跟人類青少年搶風頭。
奧特曼治下的OpenAI,最近除了丟人就丟人了。
DeepMind官宣AI拿下IMO金牌
DeepMind公告顯示,Gemini新模型做對了今年IMO六道題中的五道,獲得了35分。
并且這一成績,也獲得了IMO主席Gregor Dolinar的親自認證:
我們可以確認,谷歌DeepMind已達到人們夢寐以求的里程碑,獲得了35分(滿分42分)——堪稱金牌。
他們的解決方案在很多方面都令人驚嘆。IMO評分員認為這些解決方案清晰、精準,而且大多數都易于理解。

不僅評分遵循IMO未公開的規則,所用時間標準也和人類選手完全一致——4.5小時之內答完交卷。
而去年DeepMind的銀牌成績,是用AlphaProof和AlphaGeometry一起做了三天才獲得的。
這次不僅用時更短,答題過程也是全程自然語言、端到端完成,不再像去年那樣專門修改題目格式。
DeepMind高級科學家兼IMO團隊負責人Thang Luong表示,這與去年相比是一個范式轉變。

此外,DeepMind研究員、布朗大學教授Junehyuk Jung介紹,在今年的第三題中,很多人類選手使用了研究生水平的方案(IMO為高中競賽),但Gemini僅使用了初等數論知識就給出了自洽的證明。

Jung還表示,Gemini沒答對的最后一題,是一開始方向就錯了,不過人類選手中做對這道題的也只有五個人。

順便說一下,谷歌已經將Gemini做對的五道題的答案完整公開(鏈接見文末),有興趣的話可以驗證一下~

這次DeepMind用來參賽的,是一款暫未公開的全新模型,搭載了Deep Think推理模式。
DeepMind介紹,Gemini Deep Think是一種針對復雜問題的增強型推理模式,融合了其最新的一些研究技術,包括并行思維。
這種模式使模型能夠同時探索并組合多種可能的解決方案,最終得出最終答案,而不是追求單一的線性思維鏈。
為了充分利用Deep Think的推理能力,DeepMind額外訓練了 Gemini 的這一版本,使其能夠利用更多多步推理、問題求解和定理證明數據。
此外DeepMind還為Gemini提供了精選的高質量數學題庫,并在其指令中添加了一些關于如何解答IMO題目的通用提示和技巧。
如哈薩比斯所說,該模型已經提供給數學家等人群進行小范圍測試,后續會開放給Google AI Ultra訂閱用戶使用。

當然,DeepMind今天的官宣,也是獲得了各種稱贊。
DeepMind宣布成績,被硅谷夾道歡迎
包括來自友商的稱贊在內,DeepMind獲得了整個硅谷的夾道歡迎。
除了開頭馬斯克那句簡單的Congrats之外,還有Meta AI科學家稱贊Gemini給出了清晰、精準、非常適合自學的解決方案。

受歡迎的原因,不僅是表現優秀,也包括谷歌對IMO規則的尊重。
Gemini參加挑戰是受到了IMO官方邀請,所有規則標準都和人類一致。
并且,DeepMind也遵守了IMO官方的要求,沒有急于宣布結果。

仔細研究哈薩比斯的推文,只字未提OpenAI,但又處處在針對OpenAI。
哈薩比斯的三條回復,主要強調了這么幾點:官宣是沒有搶跑的,成績是IMO認證的,模型也是未來可用的。

這三點,剛好和搶先宣布奪金結果被錘的OpenAI形成了鮮明對比。
IMO評審團和協調員們普遍認為,AI開發商在IMO期間(尤其是閉幕式之前)宣布成績是“粗魯且不恰當的”。

除了公告發布時間的問題,OpenAI到底得沒得金牌也有爭議。
領導DeepMind超級推理團隊的Thang Luong補充,IMO內部其實有一份官方評分指南,外部無法獲取。沒有基于該指南的評分就沒有資格獲得獎牌。
這屆IMO共6道題,每題7分。金牌線35分,OpenAI自報的成績也剛剛過線,即使是解答過程中微小的扣分都可能讓OpenAI從金牌跌到銀牌。

有網友評價:OpenAI一如既往的為了炒作什么都干得出來。沒有官方分數,沒有耐心,也沒有羞恥心。

此外,OpenAI參賽用的模型也是未公開版本,并且可能以后也不會公開。
總之是處處和谷歌對比鮮明。
OpenAI研究員回應質疑
針對以上這些質疑,OpenAI研究員Noam在給谷歌送出祝福后,也順帶進行了回應:

首先,Noam解釋OpenAI沒和IMO官方合作不是沒收到邀請,而是OpenAI自己拒絕了。

其次是關于作答過程和評分的權威性,Noam表示沒有使用RAG或者任何工具,而打分是由3位IMO獲獎者給出的。
同時Noam還公開了OpenAI模型的回答,表示任何人都可以檢查。

最后是關于宣發時間,Noam表示公布成績之前和IMO董事會成員進行過溝通,后者要求等到頒獎儀式之后再發布,OpenAI表示接受。
而OpenAI官宣的時間是在太平洋時間凌晨1點,彼時頒獎已經結束,OpenAI沒有被要求需要等到更晚的時間再發布。

雖然Noam的解釋獲得了部分網友的認可,但說一千道一萬,網友還是表示傾向于站在谷歌這一邊。

總之最近的OpenAI,除了丟人還是丟人。
小扎磨刀霍霍,奧特曼人丟了。
谷歌同場競技,奧特曼丟人了。
Gemini回答:
https://storage.googleapis.com/deepmind-media/gemini/IMO_2025.pdf
OpenAI回答:
https://github.com/aw31/openai-imo-2025-proofs/
參考鏈接:
[1]https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/
[2]https://arstechnica.com/ai/2025/07/google-deepmind-earns-gold-in-international-math-olympiad-with-new-gemini-ai/
[3]https://x.com/demishassabis/status/1947337615054671882
[4]https://x.com/polynoamial/status/1947398531259523481
- 14歲華人小孩,折個紙成美國天才少年2025-12-06
- 智能體A2A落地華為新旗艦,鴻蒙開發者新機遇來了2025-12-06
- 《三體》“宇宙閃爍”成真!免佩戴裸眼3D屏登Nature2025-12-06
- ROCK & ROLL!阿里給智能體造了個實戰演練場 | 開源2025-11-26




