一份報告看盡2025上半年AI核心趨勢，應用、模型、技術、行業全覆蓋｜量子位智庫

智庫 2025-08-11 14:46:27 來源：量子位

分析師 Xuanhao

量子位智庫 | 公眾號 AI123All

人工智能可能是人類有史以來最重要的發明，我們也正在見證AI的飛速發展，技術突破與場景落地交織推動著行業加速演進。過去半年AI圈到底有哪些核心趨勢、關鍵動態？

量子位智庫在《2025上半年AI核心成果及趨勢報告》（以下簡稱《報告》）中將從應用、模型、技術、行業4個方面進行展開，為大家介紹過去半年AI領域的核心進展。

一份報告看盡2025上半年AI核心趨勢，應用、模型、技術、行業全覆蓋｜量子位智庫

報告可點擊「閱讀原文」獲得，文末亦附有完整報告下載鏈接。

應用趨勢

Agent無疑是2025年AI圈最熱門的核心話題，一批創新性的Agent產品開始進入市場，標志著AI從單純的生成工具向智能代理的轉型。

這些通用類Agent產品通過深度整合各種工具使用能力，主打完成場景多樣的深度研究類任務，例如自動化市場調研、復雜數據分析等，其交付內容也變得更加豐富多樣，不僅限于文本輸出，還包括可視化報告、交互式海報等形式。這類產品已成為2025上半年應用領域的最大亮點。

此外，以視覺操作為核?的Computer Use Agent（CUA）開始推向市場，代表了通用類Agent的另?條路徑，正在與基于?本的深度研究類Agent融合，例如OpenAI的ChatGPT Agent、Manus等產品。

通用類Agent之外，受益于?模型在語義理解、多模態等?面的能?提升，垂直應用場景開始Agent化，自然語?操控功能正在成為垂類?作流的?部分，幫助用戶和創作者提高效率，我們已經可以觀察到垂類Agent應用開始涌現。

AI編程已成為當前最核心的垂類應用領域，正在從源頭徹底改變軟件生產方式，通過自動化代碼生成、調試和優化，縮短了開發周期。頭部編程應用在收入增長速度上創下了紀錄，獲得了市場的有效驗證，例如明星應用Cursor在短時間內年收入突破5億美元大關，不僅反映了AI編程工具的商業潛力，也證明了其在實際工程項目中的可靠性和價值，吸引了從初創企業到科技巨頭的廣泛采用。

更好用戶體驗離不開充足的上下文（Context），過去半年模型上下?協議（Model Context Protocol，MCP）發展迅速，賦能模型獲取?量外部信息、操控現有軟件應用，打開更?應用空間，但尚未達到規模化?產級?平。MCP嘗試解決模型和外界通信的標準問題，在今年上半年獲得了AI社區的大量關注。

模型趨勢

過去半年，模型推理能?在思維鏈范式下，依然可以通過堆積更多算?持續提升模型能?，其中數理類、代碼類問題提升尤其顯著，以思維鏈技術路線的提出者OpenAI為例，模型能力依然在穩步上升。

Agent不僅是應用層面的關鍵詞，模型本身也開始走向Agentic化，通過端到端訓練集成工具使用能力，相比僅基于文本的思維鏈推理有了重大提升，能夠完成更復雜和困難的任務。對于人類而言，學會使用工具、發明工具是智能演化史上的重要里程碑，而目前大模型也在深度整合工具能力來強化其智能水平。

最近半年，大模型開始端到端融合視覺和文本能力，走向多模態推理，以語言作為中樞逐漸解鎖多模態的慢思考、深推理模式。初代思維鏈推理模型的多模態能力相對薄弱，但經過半年迭代，多模態推理能力已成為推理模型的核心亮點，例如在處理圖像-文本混合任務時，模型能更好地理解上下文、進行跨模態推理，這為視覺Agent的應用鋪平了道路。

模型評估是觀察模型能力變化的關鍵，正在加速演化，傳統評估榜單（例如AIME、GPQA、MMLU等）在快速飽和。靜態榜單的評測分數局限性越來越大，用戶更希望模型能夠貢獻實際生產力，而非一味刷榜，因此未來可以動態更新，能在真實世界產?實用價值任務成為重要評估?向。

技術趨勢

底層技術范式決定了模型會有什么樣的能力，目前從模型訓練階段上來看，資源投?向后訓練和強化學習傾斜，但預訓練仍然有充?的優化空間，?者最終共同決定模型能?。

多智能體（Multi-Agent）系統可能成為繼思維鏈推理模型之后的下一個前沿范式，繼續提高智能上限，是Agent技術的下一步演進方向。頭部模型廠商如OpenAI、xAI和Anthropic已經在部分功能上開始落地Multi-Agent技術，例如協作式問題求解、深度研究場景，但整體上還處于早期探索階段，但為未來構建更復雜的AI生態系統打開了更多可能。

谷歌和強化學習之父Richard Sutton提出了“經驗時代”（Era of Experience），強調AI和世界進行實時交互的重要性。從交互經驗中學習有希望成為下?代模型學習?式，正在成為核?突破?向，可使模型擺脫對?類數據的依賴，提?智能上限，目前該領域還處于早期研究狀態。

AI內容的生成和驗證具有不對稱性，生成相對容易，而驗證是否可靠、正確需要的成本高難度大，以AI編程為例，代碼驗證成為目前AI編程自動化?平提升的前沿?向，可進?步加速軟件?產自動化。

行業趨勢

在上半年的AI大模型競爭中，xAI發布Grok 4，在多個領域達到SOTA?平，躋身全球?模型第?梯隊，正在改變模型競爭格局，證明?模型的業務模式本身沒有護城河，只是進入壁壘極高。

量子位智庫認為算?是AI競賽中的關鍵要素，強化學習對算?的需求超過預訓練，頭部?模型玩家的計算集群已達到數?萬卡規模，并在持續擴張中。從“Bitter Lesson”的視角，AI的智能程度最終取決于算?的規模，擁有強?的計算資源是參與AI競爭的核心。

海外頭部玩家的競爭動態上，上半年OpenAI技術領先優勢明顯弱化，海外頭部玩家?平趨同，?歌和xAI在2025年上半年迎頭趕上，模型在多個領域達到SOTA?準，例如Gemini 2.5 Pro在發布后受到社區好評，發布性能頂尖的視頻生成模型Veo 3。

今年上半年，我們也觀察到中美?模型技術差距縮小，中國模型公司在通用?模型之外的其他領域可以達到SOTA?平，尤其多模態領域表現出色。

關于國內大模型創業公司格局，我們觀察到上半年各家路線開始分化，一些廠商積極發布前沿模型產品，追求智能上限的突破，保持技術驅動；其他廠商則專注垂類領域和商業化落地，放緩對通用模型的投入，轉而強調實際營收和市場滲透。

更多詳細內容，可在完整報告中獲取。

報告下載鏈接：https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f?from=from_copylink

AI 趨勢

智庫

一份報告看盡2025上半年AI核心趨勢，應用、模型、技術、行業全覆蓋｜量子位智庫

應用趨勢

模型趨勢

技術趨勢

行業趨勢

相關閱讀

鵝廠機器狗花式穿越10m梅花樁：前空翻、單樁跳、起身作揖...全程不打一個趔趄

全球首個AI Agent交易市場MuleRun發布2.0版本，上線一個月用戶數突破50萬

兼得快與好！訓練新范式TiM，原生支持FSDP+Flash Attention

網易AI孵化項目獲上億元首輪融資，主打AR+AI

解鎖產業互聯網新周期，他們都說了什么

20+頂尖高校同時開打《王者榮耀》！實際上是一場科研battle，你能信？

熱門文章

DeepSeek-V3.2系列開源，性能直接對標Gemini-3.0-Pro

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

前端沒死，AI APP正在返祖

寧德時代給9萬+基層員工漲了薪！每月150元

一份報告看盡2025上半年AI核心趨勢，應用、模型、技術、行業全覆蓋｜ 量子位智庫

應用趨勢

模型趨勢

技術趨勢

行業趨勢

相關閱讀

鵝廠機器狗花式穿越10m梅花樁：前空翻、單樁跳、起身作揖...全程不打一個趔趄

全球首個AI Agent交易市場MuleRun發布2.0版本，上線一個月用戶數突破50萬

兼得快與好！訓練新范式TiM，原生支持FSDP+Flash Attention

網易AI孵化項目獲上億元首輪融資，主打AR+AI

解鎖產業互聯網新周期，他們都說了什么

20+頂尖高校同時開打《王者榮耀》！實際上是一場科研battle，你能信？

熱門文章

DeepSeek-V3.2系列開源，性能直接對標Gemini-3.0-Pro

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創 語音交互新范式

商湯分拆了一家AI醫療公司，半年融資10億，劍指“醫療世界模型”

前端沒死，AI APP正在返祖

寧德時代給9萬+基層員工漲了薪！每月150元

一份報告看盡2025上半年AI核心趨勢，應用、模型、技術、行業全覆蓋｜量子位智庫

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創語音交互新范式