最新一期權(quán)威大模型榜單:豆包1.5、商湯日日新V6并列國內(nèi)第一
總量為1579道多輪簡答題
5月28日,權(quán)威大模型測評機(jī)構(gòu)SuperCLUE《中文大模型基準(zhǔn)測評2025年5月報(bào)告》全新出爐!
豆包1.5·深度思考模型(Doubao-1.5-thinking-pro)和商湯日日新 V6多模態(tài)模型(SenseNova-V6 Reasoner)共同摘得金牌,超越Gemini 2.5 Flash Preview,在國內(nèi)大模型第一梯隊(duì)領(lǐng)跑。
位居第二梯隊(duì)的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

來自SuperCLUE
報(bào)告指出,國內(nèi)外第一梯隊(duì)大模型在中文領(lǐng)域的通用能力差距正在縮小。在國產(chǎn)大模型中,
Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表現(xiàn)最為亮眼。國內(nèi)推理模型競爭格局初露端倪。
SuperCLUE是行業(yè)權(quán)威的通用大模型的綜合性測評基準(zhǔn)。本次2025年5月報(bào)告聚焦通用能力測評,涵蓋數(shù)學(xué)推理、科學(xué)推理、代碼生成、智能體Agent、精確指令遵循、文本理解與創(chuàng)作六大任務(wù),總量為1579道多輪簡答題。
版權(quán)所有,未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用,違者必究。
- 云計(jì)算一哥10分鐘發(fā)了25個(gè)新品!Kimi和MiniMax首次上桌2025-12-03
- Ilya剛預(yù)言完,世界首個(gè)原生多模態(tài)架構(gòu)NEO就來了:視覺和語言徹底被焊死2025-12-06
- 前端沒死,AI APP正在返祖2025-12-02
- 華為新架構(gòu)砍了Transformer大動(dòng)脈!任意模型推理能力原地飆升2025-12-06




