AI時代不看獨角獸,看10億Tokens日均消耗
Agent+AI Infra,百萬億Tokens消耗不是夢
明敏 發自 凹非寺
量子位 | 公眾號 QbitAI
創立10年內估值超過10億美元的創新公司,被稱之為獨角獸,它們是市場潛力無限的績優股,是為行業帶來技術創新、模式創新的佼佼者。
大模型時代中,類似的新價值紅線也正在形成——
日均10億Tokens消耗量,AI業務跑通的基本標準。
量子位結合2024下半年市場數據盤點,達到這一紅線的中國企業,至少200家,覆蓋企服、陪伴、教育、互聯網、游戲、終端等領域。

這意味著,大模型時代的“搶風口”大戰告一段落,真正具備價值參考的商業模式開始明確。
各個垂直領域的先行者能夠找到場景,做到單日至少消耗10億Tokens,就是最直接的證明。
不過問題是,日均10億Tokens基準線,why?
看日活、看單用戶Tokens消耗
首先來計算下,日均10億Tokens消耗量是什么概念?
參考DeepSeek API文檔中給出的標準:
1 個英文字符 ≈ 0.3 個 Token。
1 個中文字符 ≈ 0.6 個 Token。
在中文世界里,10億Tokens約代表16億+漢字。換算成對話量,一本《紅樓夢》的字數在70-80萬左右,相當于一天和AI聊了2000本《紅樓夢》的內容。
按照一個生成式AI模型單次響應平均需要處理1000個Tokens估算,10億Tokens意味著一天將完成100萬次響應。
如果是To C應用,100萬次響應背后,至多將是100萬DAU。
以作業幫為例,僅推算其旗下出海產品Question.AI的數據,單日消耗Tokens就接近10億規模。
這款AI教育App以大模型為基礎,它支持拍圖搜題、智能助教等功能,能以Chatbot的形式講解回答問題。
根據作業題目以及實際場景問答預估,一輪對話Tokens消耗量500,單人單日平均對話至少3輪。已披露數據顯示,Question.AI的DAU將近60w。
由此推算,僅Question.AI的單日Tokens消耗量已接近10億規模。與此同時,作業幫還布局多款AI應用,并推出了多款AI學習機,每日Tokens消耗總量只會更多。

再來看AI陪聊賽道的筑夢島。
根據最新披露消息,筑夢島累計創作者數量超50萬人,Top20人物中以原創人物為主,占比85%。筑夢島用戶平均單用戶單日輸入字數可達4000字以上,人均日對話輪次超120輪。
單用戶單日平均獲得的AI輸出,按照輸入的2-3倍計算,大約在8000-12000字(AI輸出包括AI虛擬人對話回復、AI生成提示回答等)。
量子位智庫數據顯示,筑夢島DAU目前在10萬水平。由此可以推算,筑夢島單日Tokens消耗量超過10億規模。

如果來到終端場景,Tokens的消耗方式則變得更加多元。
AI手機中除了智能助手,還有各種滲透在系統里的AI功能,比如一鍵路人消除、通話總結、一鍵識屏等。據OPPO 2024年10月數據,小布助手月活突破1.5億。
更進一步,云廠商披露的Tokens調用量以及合作客戶情況也為這一基準提供參考。
2024年7月,騰訊混元披露單日調用量達千億Tokens(包含自身業務)。
2024年8月,百度披露文心大模型日均調用量超6億次,日均處理Tokens文本超1萬億;截止11月初文心大模型的日均調用量——超過 15 億次。一年前這個數據是5000萬次,一年增長了30倍。
2024年7月,豆包大模型平均每家企業客戶日均Tokens使用量增長了22倍。12月字節最新透露,豆包通用模型日均Tokens使用量超過4萬億。

如此消耗,來自于誰?
參考火山引擎官網披露的客戶名單,來自汽車、金融、互聯網、消費零售、智能終端、游戲、醫療健康賽道的頭部廠商們都很突出,也都是大家耳熟能詳的品牌。
與此同時,這群“10億Tokens俱樂部成員”在2024年過得如何,也為這一價值紅線提供了有力參考。
AI業務成為拉動增長的關鍵貢獻
首先來在海外異軍突起的作業幫。
2023年9月,作業幫推出融合多年教育數據和AI算法積累的銀河大模型。它專門為教育領域打造,覆蓋多學科、多學段、多場景。
據Sensor Tower監測2024上半年數據,其旗下出海產品Question.AI殺入美國AI類應用下載量前三,并拿下百萬MAU。另一款對話型AI產品Poly.AI同樣進入下載的前三十名。

另一邊,在更能帶來直接營收的AI學習機方面。
2024年7月,沙利文調研認證作業幫在上半年拿下中國全網學習機銷量第一。洛圖科技數據顯示,2024年第三季度,作業幫學習機產品以20.6%的市場份額位居線上市場銷量榜首。

企業服務領域,金山云在2024年第一季度財報中明確表示,該季度總收入環比穩定增加3.1%,主要來自于AI相關客戶。
公有云收入11.87億元,較上季度增長12.9%,主要由AI客戶貢獻。在主動縮減CDN服務規模的情況下,這部分增長拉動整體公有云收入,較2023年同季度增加2.9%。
這種趨勢在第二季度、第三季度延續,AI客戶依舊貢獻了公有云業務以及整體收入的主要增長。
再來看離大家日常生活最近的AI手機。
在大模型趨勢開啟后,OPPO旗幟鮮明擁抱浪潮,將生成式AI功能引入ColorOS以及全產品系列,2024年讓將近5000萬OPPO用戶的手機搭載GenAI功能。
Counterpoint數據顯示,2024年全球前四大(市場占有率)智能手機廠商分別為三星、蘋果、小米、OPPO。
而根據Canalys的數據,2024年,全球16%的智能手機出貨量為AI手機。預測顯示,到2028年這一比例將激增至54%。2023年至2028年間,AI手機市場預計將以63%的年均復合增長率(CAGR)增長。這一轉變將首先在高端機型上出現。
比如OPPO最新發布的Find X8系列,AI味就更加濃厚。通過引入豆包通用模型Pro、豆包通用模型Lite、豆包?角色扮演模型以及更強的大模型實時聯網檢索能力,OPPO Find X8系列可以提供更加細致的AI服務體驗。

這種趨勢反映到云計算領域,則是更大規模的Tokens消耗量。
火山引擎譚待曾在采訪中表示:
五年后,企業用到的日均Tokens可能達到幾百萬億,尤其在多模態大模型推出后,各場景內都會有Agent助理跟隨,帶來很大的消耗量。
得出如此數據預估背后,是對算力基礎設施、Agent發展、AI應用開發以及整體大模型落地變化的細微洞察。
Agent+AI Infra,百萬億Tokens消耗不是夢
先從應用落地角度來看,Agent趨勢愈加明顯,AI原生應用開始發力。
OpenAI CEO奧特曼的年終盤點中提到:
我們相信,在 2025 年,我們可能會看到第一批人工智能代理 “加入勞動力大軍”,并實質性地改變公司的產出。
緊接著,OpenAI身體力行,上線Agent能力,ChatGPT開始有了執行力,可以替人完成各種任務。

更落地層面,量子位智庫觀測到AI原生應用開始發力。
伴隨著底層模型能力不斷升級,AI智能助手APP在過去一年中增長明顯。
2024年,AI智能助手APP端的新增用戶規模就超過3.5億。12月的單月新增用戶超過5000萬,相較于2024年初實現了近200倍的增長。
以豆包為例。豆包在9月成為國內用戶規模破億的首個AI應用后,目前以超50%的市場份額坐實“國民級AI原生應用”和“AI智能助手APP No.1”。

就在今天,豆包大模型1.5 Pro最新上線,能力全面提升。通過MoE架構優化,用1/7參數量就超過了稠密模型性能。
多模態能力上,視覺能力支持動態分辨率、可處理百萬級分辨率圖片,在多個基準測試中表現優異;語音方面創新提出Speech2Speech端到端框架,實現語音和文本模態深度融合,提升語音對話的理解力和表現力。
同時還通過RL方法大幅提升模型推理能力,階段性進展Doubao-1.5-Pro-AS1-Preview在AIME上已經超過o1-preview、o1等推理模型。
更強大的底層模型無疑為AI原生應用提供了更堅實底座。

聚焦到企業側,切實的增長發生的更早。Agent開發平臺成為云廠商增長最快的企服產品之一。
比如火山引擎推出的HiAgent,上線7個月已經簽下100+客戶。
它的定位是企業專屬的AI應用創新平臺,目的是幫助企業能夠用零代碼或低代碼的方式走完從模型到應用的“最后十公里”。
HiAgent可以向下兼容多種模型,原生整合豆包大模型的同時還兼容第三方的閉源或開源模型,并通過提示詞工程、知識庫、插件、工作流編排四要素來輔助輕松構建智能體,預置豐富的模板和插件,并給予自定義的自由空間。
目前HiAgent已經為中國飛鶴、美宜佳、華泰證券等500強企業提供服務,落地場景200+,打造Agent 500+款。
扣子AI原生應用開發服務平臺也助力蘇泊爾、招商銀行、和府撈面、中和農信等打造企業級Agent開發上線。
相較于HiAgent,它面向AI應用開發人員不足、服務穩定性要求高的企業,降低大模型應用開發門檻。扣子作為AI應用開發平臺,提供鏈接插件、工作流、圖像流、知識庫、數據庫等一系列工具,同樣無縫銜接豆包大模型家族以及企業精調模型與開源模型,為企業用戶提供豐富應用模板,以及調測、發布、集成、觀測的全周期服務。比如使用新聞插件,就能快速打造上線一個播報最新時事新聞的AI播音員。
透過這些實際落地進展不難發現,當AI應用/Agent開發門檻大幅降低,各行各業進入到了規模化探索開發階段,頭部企業的腳步更快,更早利用大模型變革自身業務,也更先解鎖大模型紅利。
隨著行業先鋒案例陸續出現,未來AI應用落地規模還會更進一步鋪開。與此同時,如HiAgent這類平臺也會不斷進化,其能力將不局限于智能體開發,而是更進一步發展成為AI能力中臺。

再來看供給方面,2024年云計算領域最顯化的現象是“價格戰”。在這背后其實是算力成本還在進一步優化,云廠商可以繼續“以價換量”,推動AI應用落地趨勢。
行業公認,未來的計算范式應該以GPU為核心。
2024年,云廠商紛紛持續加強AI Infra能力,以應對正在爆發的大規模推理需求。
比如火山引擎推出了AI云原生方案。它支持大規模GPU集群彈性調度管理、計算產品和網絡優化都專為AI推理設計。在過去一年多的大模型應用落地戰中,火山引擎為美圖秀秀、沐瞳科技、深勢科技等提供了堅實的計算底座。
前不久,火山引擎Force冬季大會上還進一步升級了以GPU為中心的AI Infra分布式業務系統,通過vRDMA網絡支持大規模并行計算及P/D分離推理架構,提升訓練和推理效率,降低企業使用成本;EIC彈性極速緩存解決方案,實現GPU直連,使大模型推理時延降低至五十分之一,成本降低20%。
在技術門檻/模型價格不斷降低、算力成本不斷優化各種趨勢交織下,日均百萬億Tokens的消耗不是隨便說說,而是幾乎觸手可及的現實。
由此,單個企業日均10億Tokens消耗成為一條非常有價值的參考線。
第一,它代表大模型應用落地新趨勢,企業擁抱大模型紅利,要朝著這一數字前進;
第二,它成為大模型應用落地新階段的門檻,AI業務真正跑通了嗎?需求真實存在嗎?都可以此為參考系找回答。
第三,日均10億Tokens消耗也只是大模型落地“入門級水準”,單客戶百萬億、千萬億Tokens消耗是更值得期待的星辰大海。
只是隨著這一新價值基準形成,誰能成為大模型落地的“獨角獸”,能更清晰判斷了。
大模型趨勢正在進入全新階段:大規模商用落地。
生產力釋放背后,商業機會不斷涌現。我們希望通過這一系列欄目提供一種視角,分析大模型應用落地早期階段浮現出的種種規律變化,從技術維度把握創新浪潮背后的演化路線。
以上是量子位最新原創系列策劃欄目「模力熵增」第三期。
- DeepSeek-V3.2-Exp第一時間上線華為云2025-09-29
- 你的AI助手更萬能了!天禧合作字節扣子,解鎖無限新功能2025-09-26
- 你的最快安卓芯片發布了!全面為Agent鋪路2025-09-26
- 任少卿在中科大招生了!碩博都可,推免學生下周一緊急面試2025-09-20



