商湯「日日新V6.5」登頂OpenCompass全球多模態(tài)大模型榜單
領(lǐng)先Gemini 2.5 Pro以及GPT-5等國際頂尖模型
根據(jù)權(quán)威評測平臺OpenCompass多模態(tài)大模型學(xué)術(shù)榜單(Multi-modal Academic Leaderboard)最新數(shù)據(jù)顯示,商湯「日日新 V6.5」(SenseNova-V6.5 Pro)多模態(tài)大模型以82.2的綜合成績登頂榜首,領(lǐng)先Gemini 2.5 Pro以及GPT-5等國際頂尖模型。

這一佳績不僅意味著商湯「日日新 V6.5」成為全球最強多模態(tài)大模型之一,同時也是商湯在“多模態(tài)通用智能”技術(shù)戰(zhàn)略下的成果印證。商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事、首席科學(xué)家林達華在《邁向多模態(tài)通用智能:商湯的思考》中指出,智能的核心是與外界進行自主交互的能力,多模態(tài)信息感知與處理的能力是AGI的核心要求,使AI能像人類一樣,通過視覺、聽覺等多種感官接收并融合信息,實現(xiàn)更深層次的理解與推理,是邁向AGI的必由之路。
商湯「日日新V6.5」正是商湯科技以多模態(tài)為技術(shù)主軸下的最新成果。在國內(nèi)率先突破“圖文交錯思維鏈”技術(shù),「日日新V6.5」能夠像人一樣,實現(xiàn)邏輯思維和形象思維的結(jié)合,可將部分思考過程轉(zhuǎn)化為圖形化表達,具備真正的多模態(tài)思考能力,成為國內(nèi)首個擁有形象思維,實現(xiàn)圖文交錯思維的商業(yè)級大模型。
同時,憑借以思維鏈為載體、強化學(xué)習(xí)為主要途徑的新范式,「日日新V6.5」能夠在“生成-驗證-學(xué)習(xí)”的算法閉環(huán)中持續(xù)改進自身的思維,推理性能大幅提升,其中在數(shù)理、代碼、GUI操作、圖表分析、高階任務(wù)等維度的提升尤為顯著。
商湯「日日新V6.5」還通過架構(gòu)更新,采用輕量化的視覺編碼器,同時加深MLLM主干網(wǎng)絡(luò),在保證同樣性能的前提下,實現(xiàn)3倍以上的效率提升,使性能成本曲線顯著優(yōu)化,效費比優(yōu)于Gemini 2.5等國際模型。
在以多模態(tài)通向通用人工智能(AGI)的過程,商湯科技以“基礎(chǔ)設(shè)施-模型-應(yīng)用”三位一體的總體戰(zhàn)略,致力于打造業(yè)界領(lǐng)先的通用多模態(tài)大模型,并在真實場景牽引下,構(gòu)建端到端的產(chǎn)品技術(shù)競爭力。以不斷進化的多模態(tài)大模型能力為基礎(chǔ),商湯科技持續(xù)推動多模態(tài)AI從數(shù)字空間走入真實的物理世界,在真實場景中提供端到端的價值。
OpenCompass大模型開放評測體系是上海人工智能實驗室推出的一站式、大模型評估平臺,致力于提供公平、開源、可復(fù)現(xiàn)的評測標準,覆蓋了語言、多模、安全、具身智能、金融與醫(yī)療等多個方面通用能力和垂類領(lǐng)域評測,是對大模型真實能力各個維度進行全面診斷的專業(yè)綜合榜單。多模態(tài)模型公開學(xué)術(shù)榜單精選國內(nèi)外具有廣泛影響力的開源學(xué)術(shù)評測集,對行業(yè)多模態(tài)模型進行評測,采用主客觀評測相結(jié)合的評測手段,運用了CircularEval、LLM-as-a-Judge等策略,被業(yè)界視為反映大模型“應(yīng)用價值”的重要參考。
- 視頻理解霸榜!快手Keye-VL旗艦?zāi)P椭匕蹰_源,多模態(tài)視頻感知領(lǐng)頭羊2025-11-28
- 中國唯一!阿里千問斬獲全球AI頂會最佳論文2025-11-28
- 第19屆中國投資年會·有限合伙人峰會在滬成功舉辦2025-11-28
- C++之父親臨北京,AI 原生時代最值得參加的系統(tǒng)軟件技術(shù)大會日程發(fā)布2025-11-28




