商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

量子位的朋友們 2025-07-29 20:25:35 來源：量子位

核心產(chǎn)品商湯小浣熊也完成智能體升級

多模態(tài)信息感知與處理的能力，是AGI的核心要求，也是從語言模型邁向AGI的必由之路。

從多模態(tài)感知、推理，再到交互，多模態(tài)智能的演進(jìn)將驅(qū)動AI下一階段的發(fā)展。

2025年7月27日，由全國工商聯(lián)人工智能委員會傾力主辦，商湯科技承辦的【大愛無疆·模塑未來】WAIC 2025大模型論壇上，商湯科技發(fā)布全新「日日新SenseNova V6.5」（簡稱“日日新V6.5”）大模型體系，多模態(tài)基座大模型迎來突破性升級，帶來AI從“生產(chǎn)力工具”到“生產(chǎn)力”的跨越。商湯旗下核心產(chǎn)品商湯小浣熊也完成智能體升級。

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

1950年，圖靈通過“模仿游戲”將AI定義為“類人能力”，但實(shí)際的AI一直未能擺脫“工具”的范疇，一度陷入發(fā)展低谷。而在大模型時(shí)代，AI 憑借多模態(tài)融合能力的突破，逐步觸達(dá) AGI 邊界，真正開始向“類人”標(biāo)準(zhǔn)靠近。

全國工商聯(lián)人工智能委員會主席團(tuán)首任輪值主席、商湯科技董事長兼首席執(zhí)行官徐立表示：“商湯科技始終探尋人工智能本質(zhì)，以技術(shù)創(chuàng)新激發(fā)最大智能，推動AI完成從“工具”到‘人’的躍遷，成為真正的生產(chǎn)力。”

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

日日新V6.5煥新：突破性升級觸碰“理解的深度”

商湯「日日新V6.5」多模態(tài)基座大模型帶來三大突破性升級：

強(qiáng)推理：圖文交錯(cuò)多模態(tài)思維鏈，推理性能比肩 Gemini 2.5 Pro、Claude 4-Sonnet；

高效率：多模態(tài)架構(gòu)優(yōu)化，性價(jià)比提升3倍以上；

智能體：數(shù)據(jù)分析大幅領(lǐng)先，支持端到端的場景落地，實(shí)現(xiàn)價(jià)值閉環(huán)。

通過多模態(tài)思維鏈數(shù)據(jù)進(jìn)階圖文交錯(cuò)思維鏈數(shù)據(jù)合成，商湯「日日新V6.5」多模態(tài)推理與交互性能實(shí)現(xiàn)了大幅提升：

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

商湯「日日新V6.5」率先突破圖文交錯(cuò)思維鏈技術(shù)，在大模型中引入形象思維，成為國內(nèi)首個(gè)實(shí)現(xiàn)圖文交錯(cuò)思維的商業(yè)級大模型。

在人類的思考中，形象思維和邏輯思維同等重要，兩者有機(jī)結(jié)合才能形成全面的思維能力。所謂“一圖勝千言”，一幅圖往往比大段文字更能引發(fā)有效思考。當(dāng)前，主流的多模態(tài)模型雖然已經(jīng)實(shí)現(xiàn)了在輸入端融合多種模態(tài)，但思考推理過程依然主要依賴語言推理，圖形和空間推理仍存在短板。

多模態(tài)思維鏈構(gòu)造的關(guān)鍵在于信息的圖形化表達(dá)，相比純文本思維鏈更具挑戰(zhàn)，不僅要呈現(xiàn)文字思考過程，還需生成作為思考節(jié)點(diǎn)的圖像，難以通過純?nèi)斯し绞酱笠?guī)模實(shí)現(xiàn)。商湯研發(fā)團(tuán)隊(duì)先基于對思維過程的理解構(gòu)造種子數(shù)據(jù)，經(jīng)監(jiān)督微調(diào)（SFT）訓(xùn)練讓模型初步具備圖文交錯(cuò)思考能力，再通過多輪強(qiáng)化學(xué)習(xí)顯著提升多模態(tài)推理能力。

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

同時(shí)，商湯還改進(jìn)了多模態(tài)模型的融合架構(gòu)，促進(jìn)跨模態(tài)早期融合。新的架構(gòu)采用了顯著變輕的視覺編碼器，以及深而窄的主干模型，使得視覺表征在前饋計(jì)算早期就與語言進(jìn)行對齊和交融，從而使感知更高效，模態(tài)融合更深。

得益于模型架構(gòu)的改進(jìn)，商湯「日日新V6.5」在實(shí)現(xiàn)成本優(yōu)化的同時(shí)，預(yù)訓(xùn)練吞吐量提升了20%以上，強(qiáng)化學(xué)習(xí)效率提升了40%，推理吞吐量提升了35%以上，取得性能和成本的完美平衡。相較「日日新V6.0」，「日日新V6.5」將性價(jià)比提升了3倍。

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

AI是生產(chǎn)力：商湯小浣熊，辦公最強(qiáng)智能體登場

大語言模型已成為當(dāng)下不少人的工作輔助工具，但僅靠大語言模型，不足以讓AI完成從“工具”向“人”的躍升。

人類的日常任務(wù)活動，天然涉及對文本、圖像、視頻、網(wǎng)頁等多模態(tài)信息的處理。從生產(chǎn)力工具到生產(chǎn)力，關(guān)鍵就在于多模態(tài)信息的輸入、處理與輸出能力。

基于「日日新V6.5」強(qiáng)大的多模態(tài)數(shù)據(jù)分析能力，商湯小浣熊全面升級：能夠勝任多模態(tài)復(fù)雜輸入，進(jìn)行多模態(tài)融合深入分析，給出多模態(tài)結(jié)果輸出，實(shí)現(xiàn)專業(yè)的可視化呈現(xiàn)，打造“辦公場景的AI生產(chǎn)力”，讓AI實(shí)現(xiàn)從「生產(chǎn)力工具」到「生產(chǎn)力」的跨越。

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

同時(shí)，商湯小浣熊始終保持世界領(lǐng)先的復(fù)雜數(shù)據(jù)分析能力。在客戶場景的綜合測試中，小浣熊達(dá)到在數(shù)據(jù)分析和智能體領(lǐng)域的國際標(biāo)桿 Claude 4 Opus 的水平，大幅領(lǐng)先OpenAI o3等模型。其中，在時(shí)序計(jì)算、數(shù)據(jù)匹配、數(shù)理計(jì)算和異常檢測等任務(wù)中，準(zhǔn)確率均可接近 100%。

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

現(xiàn)實(shí)辦公場景中，數(shù)據(jù)輸入形式極為復(fù)雜。在數(shù)據(jù)分析場景中，截圖、文檔和PDF等各類樣式的文檔屢見不鮮，而其中結(jié)構(gòu)化信息及表格僅占約70%。即便是看似基礎(chǔ)的 Excel 表格，也常包含合并單元格、缺失值、嵌套子表格及內(nèi)嵌圖表等復(fù)雜元素，大幅提升處理難度。

商湯小浣熊能夠以多模態(tài)思維實(shí)現(xiàn)全局分析，通過思維鏈構(gòu)造進(jìn)行多步思考與反思，最終輸出結(jié)構(gòu)化的結(jié)果。

事實(shí)上一個(gè)表格看著簡單，背后的邏輯因果卻非常復(fù)雜，如今商湯小浣熊可以讓復(fù)雜表格簡單化。

用戶上傳包含合并單元格、缺失值、子表格、內(nèi)嵌圖表及外部圖片的復(fù)雜 Excel 表格。商湯小浣熊能夠精準(zhǔn)解析表格內(nèi)容，建立子表格間的邏輯關(guān)聯(lián)，最終生成完整的分析報(bào)告。

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

另一個(gè)復(fù)雜輸入的用戶案例，小商戶在抖音等視頻平臺刷到有用的表格內(nèi)容，截圖后上傳。商湯小浣熊可以通過圖片信息分解任務(wù)并去除干擾，提取表格信息，一鍵導(dǎo)出可編輯的Excel 表格供用戶填寫，輸入、分析、輸出全程都有多模態(tài)能力支持順暢進(jìn)行。

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

傳統(tǒng)AI工具多扮演輔助角色，核心工作仍依賴用戶主導(dǎo)完成；而商湯小浣熊實(shí)現(xiàn)了交互范式的升級——由AI主動承擔(dān)核心任務(wù)，并通過精準(zhǔn)提問和用戶確認(rèn)關(guān)鍵信息，交互邏輯如同同事協(xié)作。

由AI主動承擔(dān)核心任務(wù)，并通過精準(zhǔn)提問和用戶確認(rèn)關(guān)鍵信息，交互邏輯如同同事協(xié)作。

商湯小浣熊如今推出的任務(wù)規(guī)劃功能，其新穎的交互模式更利于用戶理解，以前段時(shí)間大火的“蘇超”為例。

用戶上傳圖像表格，要求分析“蘇超”TOP球員。商湯小浣熊會自動抓取網(wǎng)上信息，并依托專家知識生成任務(wù)清單（如確定 “TOP5” 標(biāo)準(zhǔn)，分析青訓(xùn)成績等）進(jìn)行系統(tǒng)性分析，最終生成高質(zhì)量分析文檔，還可導(dǎo)出為 Excel、PPT、HTML 等可編輯格式。整體流程如下↓↓↓

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

我們來看下分解步驟：當(dāng)接收任務(wù)后，小浣熊會主動梳理任務(wù)細(xì)節(jié)，就關(guān)鍵節(jié)點(diǎn)向用戶提出明確問題（如 “是否需要按以下 1、2、3 點(diǎn)推進(jìn)？”），以確保任務(wù)方向準(zhǔn)確，真正實(shí)現(xiàn) “AI 主導(dǎo)干活、用戶決策把關(guān)” 的高效模式↓↓↓

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

接下來就能依據(jù)專家知識生成任務(wù)清單（如確定 “TOP5” 標(biāo)準(zhǔn)，分析青訓(xùn)成績等）進(jìn)行系統(tǒng)性分析，下一步該做什么、可以怎么商量著做一目了然↓↓↓

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

專業(yè)數(shù)據(jù)+工具調(diào)用，實(shí)現(xiàn)高質(zhì)量內(nèi)容過程↓↓↓

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

最終生成高質(zhì)量分析文檔，還可導(dǎo)出為 Excel、PPT、HTML 等可編輯格式↓↓↓

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

憑借強(qiáng)大的復(fù)雜任務(wù)處理能力，商湯小浣熊加速向行業(yè)滲透，此次推出了面向兩大具體場景的特制版本——教育版和金融版。

商湯小浣熊教育版可智能分析學(xué)生學(xué)習(xí)表現(xiàn)、課程效果、學(xué)習(xí)行為模式分析，目前已覆蓋500+院校、10余種教育場景、25萬+教師和學(xué)生，幫助學(xué)生提升學(xué)習(xí)效率15~30%，并已在多所學(xué)校協(xié)助教研團(tuán)隊(duì)，降低學(xué)業(yè)焦慮發(fā)生率 40%，課堂參與度提高 2.1倍，資源錯(cuò)配率降低30%，心理健康干預(yù)及時(shí)性提升了50%。

商湯小浣熊金融版可為金融業(yè)提供知識助手、智能問數(shù)、多模態(tài)智能理賠產(chǎn)品與解決方案，構(gòu)建金融領(lǐng)域的“人機(jī)協(xié)同”智能決策新范式。

截至目前，“商湯小浣熊家族”產(chǎn)品矩陣廣泛服務(wù)多行業(yè)企業(yè)，用戶數(shù)量實(shí)現(xiàn)1000萬+。

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

以多模態(tài)技術(shù)激活A(yù)I生產(chǎn)力，商湯日日新大模型將持續(xù)進(jìn)化，與行業(yè)共同奔赴下一階段AI進(jìn)化的新征程，加速通往AGI時(shí)代。

版權(quán)所有，未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用，違者必究。

2025 WAIC 商湯

量子位的朋友們

商湯「日日新6.5」全新升級，讓AI完成從“工具”到“人”的躍遷

日日新V6.5煥新：突破性升級觸碰“理解的深度”

AI是生產(chǎn)力：商湯小浣熊，辦公最強(qiáng)智能體登場

相關(guān)閱讀

商湯“奪金”SuperCLUE-V多模態(tài)大模型基準(zhǔn)10月榜單

商湯再挖MSRA大將：R-FCN作者代季峰加盟任執(zhí)行研究總監(jiān)

CVPR 2020商湯斬獲3冠！62篇論文入選，“算法工廠”憑什么領(lǐng)跑行業(yè)？

商湯最新論文登上ICLR 2022：給注意力機(jī)制Softmax找個(gè)“平替”

悼念！商湯創(chuàng)始人湯曉鷗逝世，享年55歲

66篇論文入選CVPR 2021，商湯的秘籍竟是“大力出奇跡”

熱門文章

英偉達(dá)巧用8B模型秒掉GPT-5，開源了

“豆包手機(jī)”在二手市場價(jià)格都翻倍了……

DeepSeekV3.2技術(shù)報(bào)告還是老外看得細(xì)

谷歌新架構(gòu)突破Transformer超長上下文瓶頸！Hinton靈魂拷問：后悔Open嗎？

SpaceX估值8000億美元超OpenAI，IPO就在明年