訊飛星火4.0霸榜八個榜單，大秀語音識別遭有預謀干擾

白交 2024-06-28 20:31:14 來源：量子位

主打懂你的AI助手

游魚發自凹非寺

量子位 | 公眾號 QbitAI

很炸裂！訊飛星火大秀語音識別能力，現場掌聲雷動——

三個人同時說話，再加上背景音樂，如此強干擾的場景，大模型卻表示都能聽懂聽清，還瞬間轉化為文字，語音識別的“雞尾酒會”難題不在話下~

好，就只聽到了最后的北京烤鴨，誰懂……

不得不承認，幾個月一度的科大訊飛發布會每次都干貨滿滿，此次也同樣帶來了驚喜。

訊飛星火4.0版本來襲，此次7大底座能力提升，八大榜單第一，全面對標GPT-4 Turbo。

除此之外，訊飛星火APP/Desk、語音大模型也迎來了一眾升級。

快來看看此次有什么樣的新發布~

訊飛星火4.0有多強？八個榜單第一

首先來看看底座大模型訊飛星火4.0的全新升級，主要在這幾個方面：

基礎能力上：文本生成、語言理解、知識問答、邏輯推理、數學代碼以及多模態能力都全面升級，并且全面對標GPT-4 Turbo；
圖文識別能力上也在持續升級之中，尤其像關于版面的復雜理解、融合篇章語義的文字識別、專業領域的符號識別等方面，在科研、金融、醫療、司法等行業領域都比GPT-4o更強。

復雜指令、復雜邏輯推理、空間推理、數學、基于邏輯關系的多模理解等復雜能力上皆也有所提升。比如，能根據幾張圖來梳理出圖中內容的邏輯關系，這些能力的提升可以加速大模型實際應用的腳步。

在國內外中英文12項主流測試集中，星火V4.0實現了8項第一，包括理解推理、綜合考試、數學等維度的中英文測試。

不過劉慶峰坦言，此次在代碼和多模態能力還有所差距。

值得一提的是，此次星火長文本通用能力也進行了全新升級，并首發了內容溯源功能。

訊飛研究院院長劉聰也進行了現場演示，扔了一本中文版西游記和英文版哈利波特給它，問：

孫悟空的金箍棒和哈利波特的魔杖有什么不同？

除了按部就班的回答之外，在回答之中文字上面有小旗幟標識，一點開就會發現來源在哪。

這樣一來，大模型的幻覺能夠極大的降低，相當于星火在回答你的問題時，還告訴你為什么會這么回答，是參考了哪一段內容，省去你去全文核對的時間，只需核實它的的溯源即可。

而且注意到，這里面不局限于中文，英文溯源同樣也能實現。星火大模型并非將英文翻譯成中文，而是直接找對應關系，是真正基于英文自動訓練出來的英文溯源能力。

當然，這個內容來源也不局限于文本，包括像語音、視頻也都不在話下。

好了，底座能力基本已經了解，現在網頁版和App端也都已全面升級，這就來淺測一番。

首先來看看前段時間難倒一波大模型的高考數學，訊飛星火4.0如何應對，直接拿直接拿高考一卷的前4個客觀選擇題試試手：

查看題目，給出這道題的答案。

結果四道題全對，解析也都完全正確，該說不說，是有點東西的啊~

再來看看它的多模理解能力，能否從幾個圖中找到對應的邏輯關系。

對于一則漫畫，它也能清晰的判斷出里面的內容，成功回答了給出的問題：一年后，小孩是否有長高？

此外，強干擾場景下的語音識別能力也實現了突破，兩個人混疊場景準確率已經到了91%；三人混疊說話場景也能實現86%的語音識別準確率；在-5dB的高噪場景，噪音已經比人講話還要高不少的情況下，依然能做到90%以上的準確率—— 也就出現了最開始「即使七嘴八舌，也能精準識別」的場景。

語言識別的能力也越來越強，此次升級的星火語音大模型可支持74種語言免切換自由對話，包括37種語種、37種方言，不用切換，可以自由交流。

其中，37個語種識別效果領先OpenAI whisper-V3，37個方言識別效果平均提升30%

也就在前幾天，科大訊飛作為第一完成單位的《多語種智能語音關鍵技術及產業化》項目獲得國家科學技術進步獎一等獎。

這是深度學習引發全球人工智能浪潮以來，過去十年人工智能領域的首個國家科學技術進步獎一等獎。

在這基礎之上，語音領域的應用也正在被重構。星火汽車智能座艙全新升級，已經具備了多語種多方言的“自由交互”，還具備多情感多模態的超擬人交互。目前，訊飛語音交互產品國內市占率穩居第一，同時廣泛出口到世界各地。星火大模型為一汽、奇瑞、廣汽、江淮、長城等車企的眾多車型，賦予了高度智能的交互體驗。

主打個性化的AI助手

隨著底座大模型能力的升級，星火在各行業各場景中的應用體驗也進一步升維。

用科大訊飛自己話說：懂你的AI助手。

與此前「通用AI助手」定位相比，劉慶峰表示主要實現了三個能力層面的替身。

基于用戶畫像的個性化表達；
基于使用歷史的記憶學習；
基于個人資料來進行增強學習；

具體而言，在構建用戶個人畫像時，人設風格可以自己選定，也可以根據對話和使用歷史動態完善，進而形成個性化的表達風格；AI助手再結合個人資料，就可以生成個性化和針對性內容。

而現在每個人都可以通過訊飛星火APP，或者Desk界面，擁有屬于自己的個性化助手。

此次升級了「個人空間」，它能夠對你上傳的各種資料進行收集管理，構建你一個人的專屬知識庫。而大模型也可以基于你的個人資料進行增強學習。

在現場，劉聰就上傳了女兒寫作文，并選取符合女兒AI人設標簽后，后續文案生成風格都帶有他女兒人設風格。

在訊飛星火APP上，還有一個智能體功能，它將各種各樣的AI助手集成于此，包括醫療助手、英語聽說助手、數學答題助手、錄音助手、文稿寫作助手、代碼助手等等各種實用功能，你可以隨時調用。

目前首批已上線14個智能體。

而更聚焦于在具體行業應用中，星火作為「懂你的AI助手」正在不斷深入，持續創造價值。

比如醫療。當前訊飛星火醫療大模型也再次升級，醫療核心能力全面超過GPT-4 Turbo，包括醫學相關的知識問答、復雜的語義理解、專業文書生成、診斷治療以及多輪對話等各項指標。

而主打個人健康助手的訊飛曉醫APP，已經覆蓋1600種常見疾病、2800種常見藥品、6000種常見檢查檢驗，滿足用戶在看病前、用藥時、檢查后的核心場景健康需求。目前已累積1200萬下載量。用戶好評率98.8%，近一半來自用戶口碑推薦。

你可以直接詢問它一些通用問題，比如，要是失眠怎么辦？痛風患者能喝豆汁兒嗎？

訊飛曉醫APP上線了“個人數字健康空間”，可以鏈接到你自己以及家人的健康檔案，包括電子病歷、檢查報告、體檢報告等資料。當出現一些小病癥的情況，為你剖析原因；用藥時給出藥物禁忌的個性判斷，還可以對比此前報告給出數據變化。

再有就是教育領域。AI正在成為老師的教學助理、學生的學習助手。

此次底層星火大模型，在語文數學英語能力以及OCR識別能力都有了很大的提升。

在老師端，科大訊飛此次發布星火智能批閱機，他能自動批改，即掃即批，并在現場大秀操作。

批完之后，它還能對整個班級學習情況分析出來，輔助老師給出每個學生學習路徑規劃。

原本90分鐘作業批改時間，可以變成5分鐘；60分鐘的學情統計時間編程一分鐘，大大解放了老師的生產力。

而在學生端，由星火大模型搭載的AI學習機，基于底層能力提升，進一步實現了超擬人的答疑輔導。

從已有試點數據來看，孩子獨立學習完成率從67%到90%，錯題解決率從以往依靠視頻學習的72%到現在達到了93%。

除此之外，企業應用領域，還發布了企業智能體平臺、以及商機、評標、代碼等企業智能助手的亮相。

與此同時，訊飛星火的開發者生態影響還在不斷擴大——

自今年1月30日訊飛星火V3.5發布以來，短短5個月，星火開發者生態加速增長，開發者數從598萬增長到702萬，新增超104萬；海外開發者數超40萬；大模型開發者達57萬。

讓大模型更好用更實用

整個發布會看下來，科大訊飛釋放出這樣一個發力信號；

讓大模型更好用、更實用。

而要將其進一步具象化，那就是AI智能助理。

可以是一家老小的健康都被AI守護；也可以是每個人孩子一對一個性化教學中培養出主動思考的終身學習能力；還有像深入企業中經營服務場景，每個打工人都可以輕松管理自己的知識庫。

而如果貫穿整個人類文明，每一次進步背后都有一個了不起的助手，每一代助手都有它的使命。

科大訊飛的使命就是解放生產力，釋放生產力。

劉慶峰表示，希望通過我們的能力，成就每一個了不起的企業，幫助每一個人都成為了不起的自己。

而作為AI助手的“載體”——訊飛星火APP其實正在持續賦能，早已在我們身邊改變著我們的生產生活。

會上劉慶峰提供了這幾組關鍵的數字。

在安卓端，所有下載大模型相關APP中，訊飛星火APP下載量在工具類排名第一，已累計下載1.31億次。

意味著，星火APP各類助手，包括寫作、編程、工作、學習、生活、親子、翻譯等助手都在被我們日常使用，部分調用次數甚至達到了幾百萬甚至千萬級別。

不過從整個行業來看，其實這也不是什么新鮮概念，早在不少科幻電視劇、電影里面出現，直至現在大模型時代帶來，科幻場面照進現實。

誠如此前爆火的ChatGPT男友DAN、還有帶來全新人機交互熱議的GPT-4o，更多兼具功能和情感屬性的通用AI助手出現，讓人直呼：《Her》真的來了。

但能打造作為AI助手，其實并非易事。

相信很多朋友都注意到，GPT Builder即將在7月份終止服務。這個因為「每個人都能創建自己的GPT」而被寄予厚望，然而現在發布不到半年即將面臨關停。

還記得當時剛出來時，就被不少人詬病，有些定制出來的GPTs跟ChatGPT本來對話沒有什么區別，無法解決復雜指令……

當大模型產品直面用戶時，人們對它的期望和要求要遠比以往更為嚴苛。當產品現有能力無法滿足用戶需求時，很快就會被用戶淘汰，被市場淘汰……

只有不斷打磨產品能力、直擊用戶痛點，并且始終保持開放的生態，才能在這樣一個浪潮中生生不息。

至少現在來看，目前尚且還留存、持續不斷給用戶帶來服務的大模型產品，經歷住了考驗。科大訊飛就是其中一個。

而最近ChatGPT的一個決定，再次讓大模型自主可控這個命題變得尤為重要。

OpenAI的大模型，不會成為中國AI應用的基座，自然也更不會成為中國AI助手的基座。而像科大訊飛這樣的玩家，從一開始就主打自主可控——

直至現在，訊飛星火4.0還是官方認證的唯一全民開放大模型。

什么概念呢？

就是在全國產算力平臺上訓練的大模型，所有算法、每一行碼、每一個數據都是我們自主可控的大模型。

此次訊飛星火大模型的發布，是基于全國首個國產萬卡算力集群“飛星一號”。

劉慶峰表示：大模型底座能力決定發展高度，而中國需要建立自主可控的通用大模型底座。

要科學地認識大模型能力邊界，如今隨著大模型能力升級，讓每個人AI智能助理成為可能。

星火代表著一種趨勢，也正在引領著這種趨勢的發展。

大模型科大訊飛訊飛星火語音大模型

白交

空間智能卡脖子難題被杭州攻克！難倒GPT-5后，六小龍企業出手了2025-08-28
陳丹琦有了個公司郵箱，北大翁荔同款2025-08-28
英偉達最新芯片B30A曝光2025-08-20
AI應用如何落地政企？首先不要卷通用大模型2025-08-12

訊飛星火4.0霸榜八個榜單，大秀語音識別遭有預謀干擾

訊飛星火4.0有多強？八個榜單第一

主打個性化的AI助手

讓大模型更好用更實用

相關閱讀

Gemini自曝中文用百度文心一言訓練，網友看呆：大公司互薅羊毛？？

大模型免微調解鎖對話能力，RLHF沒必要了！一作上交大校友：節省大量成本和時間

十問復旦邱錫鵬：大模型進入安卓時代，希望有國產模型能代替LIama

沈向洋周明楊格大模型激辯：繼續爆堆參數，大模型能出現新的「智能涌現」嗎？

四個00后的瘋狂開源計劃：整個互聯網轉成大模型語料，1億token嵌入成本只需1美元

大模型下一步，通用群體智能有譜了 | CCF C3

熱門文章

英偉達巧用8B模型秒掉GPT-5，開源了

“豆包手機”在二手市場價格都翻倍了……

DeepSeekV3.2技術報告還是老外看得細

谷歌新架構突破Transformer超長上下文瓶頸！Hinton靈魂拷問：后悔Open嗎？

SpaceX估值8000億美元超OpenAI，IPO就在明年