商湯「日日新V6.5」登頂OpenCompass全球多模態(tài)大模型榜單

量子位的朋友們 2025-09-10 16:58:13 來源：量子位

領(lǐng)先Gemini 2.5 Pro以及GPT-5等國際頂尖模型

根據(jù)權(quán)威評測平臺OpenCompass多模態(tài)大模型學(xué)術(shù)榜單（Multi-modal Academic Leaderboard）最新數(shù)據(jù)顯示，商湯「日日新 V6.5」（SenseNova-V6.5 Pro）多模態(tài)大模型以82.2的綜合成績登頂榜首，領(lǐng)先Gemini 2.5 Pro以及GPT-5等國際頂尖模型。

這一佳績不僅意味著商湯「日日新 V6.5」成為全球最強多模態(tài)大模型之一，同時也是商湯在“多模態(tài)通用智能”技術(shù)戰(zhàn)略下的成果印證。商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事、首席科學(xué)家林達華在《邁向多模態(tài)通用智能：商湯的思考》中指出，智能的核心是與外界進行自主交互的能力，多模態(tài)信息感知與處理的能力是AGI的核心要求，使AI能像人類一樣，通過視覺、聽覺等多種感官接收并融合信息，實現(xiàn)更深層次的理解與推理，是邁向AGI的必由之路。

商湯「日日新V6.5」正是商湯科技以多模態(tài)為技術(shù)主軸下的最新成果。在國內(nèi)率先突破“圖文交錯思維鏈”技術(shù)，「日日新V6.5」能夠像人一樣，實現(xiàn)邏輯思維和形象思維的結(jié)合，可將部分思考過程轉(zhuǎn)化為圖形化表達，具備真正的多模態(tài)思考能力，成為國內(nèi)首個擁有形象思維，實現(xiàn)圖文交錯思維的商業(yè)級大模型。

同時，憑借以思維鏈為載體、強化學(xué)習(xí)為主要途徑的新范式，「日日新V6.5」能夠在“生成-驗證-學(xué)習(xí)”的算法閉環(huán)中持續(xù)改進自身的思維，推理性能大幅提升，其中在數(shù)理、代碼、GUI操作、圖表分析、高階任務(wù)等維度的提升尤為顯著。

商湯「日日新V6.5」還通過架構(gòu)更新，采用輕量化的視覺編碼器，同時加深MLLM主干網(wǎng)絡(luò)，在保證同樣性能的前提下，實現(xiàn)3倍以上的效率提升，使性能成本曲線顯著優(yōu)化，效費比優(yōu)于Gemini 2.5等國際模型。

在以多模態(tài)通向通用人工智能（AGI）的過程，商湯科技以“基礎(chǔ)設(shè)施-模型-應(yīng)用”三位一體的總體戰(zhàn)略，致力于打造業(yè)界領(lǐng)先的通用多模態(tài)大模型，并在真實場景牽引下，構(gòu)建端到端的產(chǎn)品技術(shù)競爭力。以不斷進化的多模態(tài)大模型能力為基礎(chǔ)，商湯科技持續(xù)推動多模態(tài)AI從數(shù)字空間走入真實的物理世界，在真實場景中提供端到端的價值。

OpenCompass大模型開放評測體系是上海人工智能實驗室推出的一站式、大模型評估平臺，致力于提供公平、開源、可復(fù)現(xiàn)的評測標準，覆蓋了語言、多模、安全、具身智能、金融與醫(yī)療等多個方面通用能力和垂類領(lǐng)域評測，是對大模型真實能力各個維度進行全面診斷的專業(yè)綜合榜單。多模態(tài)模型公開學(xué)術(shù)榜單精選國內(nèi)外具有廣泛影響力的開源學(xué)術(shù)評測集，對行業(yè)多模態(tài)模型進行評測，采用主客觀評測相結(jié)合的評測手段，運用了CircularEval、LLM-as-a-Judge等策略，被業(yè)界視為反映大模型“應(yīng)用價值”的重要參考。

版權(quán)所有，未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用，違者必究。