一份報告看盡2025上半年AI核心趨勢,應用、模型、技術、行業全覆蓋| 量子位智庫
分析師 Xuanhao
量子位智庫 | 公眾號 AI123All
人工智能可能是人類有史以來最重要的發明,我們也正在見證AI的飛速發展,技術突破與場景落地交織推動著行業加速演進。過去半年AI圈到底有哪些核心趨勢、關鍵動態?
量子位智庫在《2025上半年AI核心成果及趨勢報告》(以下簡稱《報告》)中將從應用、模型、技術、行業4個方面進行展開,為大家介紹過去半年AI領域的核心進展。

報告可點擊「閱讀原文」獲得,文末亦附有完整報告下載鏈接。
應用趨勢
Agent無疑是2025年AI圈最熱門的核心話題,一批創新性的Agent產品開始進入市場,標志著AI從單純的生成工具向智能代理的轉型。
這些通用類Agent產品通過深度整合各種工具使用能力,主打完成場景多樣的深度研究類任務,例如自動化市場調研、復雜數據分析等,其交付內容也變得更加豐富多樣,不僅限于文本輸出,還包括可視化報告、交互式海報等形式。這類產品已成為2025上半年應用領域的最大亮點。

此外,以視覺操作為核?的Computer Use Agent(CUA)開始推向市場,代表了通用類Agent的另?條路徑,正在與基于?本的深度研究類Agent融合,例如OpenAI的ChatGPT Agent、Manus等產品。

通用類Agent之外,受益于?模型在語義理解、多模態等?面的能?提升,垂直應用場景開始Agent化,自然語?操控功能正在成為垂類?作流的?部分,幫助用戶和創作者提高效率,我們已經可以觀察到垂類Agent應用開始涌現。

AI編程已成為當前最核心的垂類應用領域,正在從源頭徹底改變軟件生產方式,通過自動化代碼生成、調試和優化,縮短了開發周期。頭部編程應用在收入增長速度上創下了紀錄,獲得了市場的有效驗證,例如明星應用Cursor在短時間內年收入突破5億美元大關,不僅反映了AI編程工具的商業潛力,也證明了其在實際工程項目中的可靠性和價值,吸引了從初創企業到科技巨頭的廣泛采用。

更好用戶體驗離不開充足的上下文(Context),過去半年模型上下?協議(Model Context Protocol,MCP)發展迅速,賦能模型獲取?量外部信息、操控現有軟件應用,打開更?應用空間,但尚未達到規模化?產級?平。MCP嘗試解決模型和外界通信的標準問題,在今年上半年獲得了AI社區的大量關注。

模型趨勢
過去半年,模型推理能?在思維鏈范式下,依然可以通過堆積更多算?持續提升模型能?,其中數理類、代碼類問題提升尤其顯著,以思維鏈技術路線的提出者OpenAI為例,模型能力依然在穩步上升。

Agent不僅是應用層面的關鍵詞,模型本身也開始走向Agentic化,通過端到端訓練集成工具使用能力,相比僅基于文本的思維鏈推理有了重大提升,能夠完成更復雜和困難的任務。對于人類而言,學會使用工具、發明工具是智能演化史上的重要里程碑,而目前大模型也在深度整合工具能力來強化其智能水平。

最近半年,大模型開始端到端融合視覺和文本能力,走向多模態推理,以語言作為中樞逐漸解鎖多模態的慢思考、深推理模式。初代思維鏈推理模型的多模態能力相對薄弱,但經過半年迭代,多模態推理能力已成為推理模型的核心亮點,例如在處理圖像-文本混合任務時,模型能更好地理解上下文、進行跨模態推理,這為視覺Agent的應用鋪平了道路。

模型評估是觀察模型能力變化的關鍵,正在加速演化,傳統評估榜單(例如AIME、GPQA、MMLU等)在快速飽和。靜態榜單的評測分數局限性越來越大,用戶更希望模型能夠貢獻實際生產力,而非一味刷榜,因此未來可以動態更新,能在真實世界產?實用價值任務成為重要評估?向。

技術趨勢
底層技術范式決定了模型會有什么樣的能力,目前從模型訓練階段上來看,資源投?向后訓練和強化學習傾斜,但預訓練仍然有充?的優化空間,?者最終共同決定模型能?。

多智能體(Multi-Agent)系統可能成為繼思維鏈推理模型之后的下一個前沿范式,繼續提高智能上限,是Agent技術的下一步演進方向。頭部模型廠商如OpenAI、xAI和Anthropic已經在部分功能上開始落地Multi-Agent技術,例如協作式問題求解、深度研究場景,但整體上還處于早期探索階段,但為未來構建更復雜的AI生態系統打開了更多可能。

谷歌和強化學習之父Richard Sutton提出了“經驗時代”(Era of Experience),強調AI和世界進行實時交互的重要性。從交互經驗中學習有希望成為下?代模型學習?式,正在成為核?突破?向,可使模型擺脫對?類數據的依賴,提?智能上限,目前該領域還處于早期研究狀態。

AI內容的生成和驗證具有不對稱性,生成相對容易,而驗證是否可靠、正確需要的成本高難度大,以AI編程為例,代碼驗證成為目前AI編程自動化?平提升的前沿?向,可進?步加速軟件?產自動化。

行業趨勢
在上半年的AI大模型競爭中,xAI發布Grok 4,在多個領域達到SOTA?平,躋身全球?模型第?梯隊,正在改變模型競爭格局,證明?模型的業務模式本身沒有護城河,只是進入壁壘極高。

量子位智庫認為算?是AI競賽中的關鍵要素,強化學習對算?的需求超過預訓練,頭部?模型玩家的計算集群已達到數?萬卡規模,并在持續擴張中。從“Bitter Lesson”的視角,AI的智能程度最終取決于算?的規模,擁有強?的計算資源是參與AI競爭的核心。

海外頭部玩家的競爭動態上,上半年OpenAI技術領先優勢明顯弱化,海外頭部玩家?平趨同,?歌和xAI在2025年上半年迎頭趕上,模型在多個領域達到SOTA?準,例如Gemini 2.5 Pro在發布后受到社區好評,發布性能頂尖的視頻生成模型Veo 3。

今年上半年,我們也觀察到中美?模型技術差距縮小,中國模型公司在通用?模型之外的其他領域可以達到SOTA?平,尤其多模態領域表現出色。

關于國內大模型創業公司格局,我們觀察到上半年各家路線開始分化,一些廠商積極發布前沿模型產品,追求智能上限的突破,保持技術驅動;其他廠商則專注垂類領域和商業化落地,放緩對通用模型的投入,轉而強調實際營收和市場滲透。

更多詳細內容,可在完整報告中獲取。
報告下載鏈接:https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f?from=from_copylink
- AI Coding玩家圖譜:誰在押注,誰在突圍?| 量子位智庫報告2025-09-01
- AI重塑游戲未來:79%開發者擁抱,8大環節迎革新|AI+游戲產業變革研究報告發布2025-07-15
- 大模型落地與前沿趨勢研究報告 | 量子位智庫2025-06-19
- 《2024年度AI十大趨勢報告》重磅發布!技術創新、產品洗牌、行業動態一文看盡2025-06-19




