上海WAIC大會現場“大鬧天宮”:模型夠猛,產品夠酷,公司夠強
AI互動游戲爆火WAIC
衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
今年上海世界人工智能大會,誰最受關注?
展區現場,有個擠得水泄不通的互動——
像孫猴子一樣在全世界大鬧天宮的AI大模型,而且真的和《大鬧天宮》聯動!
只需一張真人正面圖片,就能get天庭打工人寸照;在測出屬于你的《大鬧天宮》版MBTI的同時,玉帝老兒還會賞咱個天上的官兒當當,何不美哉?

這個對大多數人來說見了就挪不動腿的AI互動體驗背后,背后還是一支越來越出圈的國產大模型團隊。
它不僅手握多模態能力,還在WAIC上亮出了手里最新的萬億MoE大模型。

平時低調,亮相不多,但總是一鳴驚人。
階躍星辰,微軟前全球副總裁,微軟亞洲互聯網工程院前首席科學家姜大昕創立,出道不早,但后發先至,目前已是公認的大模型第一梯隊玩家,位列大模型創業“六小強”。
而且這一次WAIC期間,階躍星辰展示的大模型能力,不只是和孫悟空攜手鬧天空那么簡單。
萬億MoE+多模態大模型
階躍目前推出的模型均為Step系列。
新模型發布之前,小結一下過去的成員:今年3月,階躍共發布3款模型,即Step-1千億參數語言大模型、Step-1V千億參數多模態大模型、Step-2萬億參數MoE語言大模型(預覽版)。
在這次WAIC,Step家族增加3名新成員。
- Step-2萬億參數語言大模型正式版
- Step-1.5V千億參數多模態大模型
- Step-1X圖像生成大模型
第一個是MoE結構的萬億參數大語言模型,后面二者則是多模態模型。
大語言模型:Step-2正式版
3月底的全球開發者先鋒大會開幕式上,階躍展示了萬億參數MoE語言大模型Step-2的預覽版。
不是我說,階躍是懂什么叫“淺嘗輒止”的,只有預覽版,讓人心癢癢。
好在階躍團隊堅信Scaling Law,因此不斷訓練更大模型。
這次,Step-2正式版終于正式亮相。
Step-2擁有萬億參數,采用MoE架構,官方介紹,Step-2在數理邏輯、編程、中文知識、英文知識、指令跟隨等方面體感全面逼近GPT-4。
背后有階躍團隊花了大心思的巧思在。
首先是創新算法架構。
一般而言,主流訓練MoE模型有兩種方式,不然就基于已有模型通過upcycle(向上復用)開始訓練,不然就從頭開始訓練。
Upcycle方式所需算力相對更低、訓練效率更高,但隨隨便便就到這種方式的天花板了。
比如基于拷貝復制得到的MoE模型,非常容易出現專家同質化嚴重的情況。
而選擇從頭開始訓練MoE模型的話,能夠探得更高的模型上限,但作為代價,訓練難度也會增大。

俗話說得好,勇敢階躍,不怕困難(doge)。
在設計Step-2的MoE架構時,階躍星辰迎難而上,完全自主研發,從頭開始訓練。
過程中,通過部分專家共享參數、異構化專家設計等創新MoE架構設計,Step-2這個混合專家模型中的每個專家都得到了充分訓練。
故而,Step-2總參數量達到萬億級別,每次訓練或推理所激活的參數量也超過了市面上的大部分Dense模型。
此外,Step-2的訓練過程中,階躍的系統團隊突破了6D并行、極致顯存管理、完全自動化運維等關鍵技術,支撐起了整個模型的高效訓練。
多模態大模型:追求多模理解和生成的統一
姜大昕曾經堅定表示過,團隊追求的是多模理解和生成的統一,“Step系列大模型將為多模理解和生成的統一奠定堅實基礎。”
于是,在多模理解方面秀肌肉的Step-1.5V多模態大模型,以及在多模生成方面小有所成的Step-1X圖像生成大模型,這次也對外發布。
Step-1.5V多模態大模型從Step-1V千億參數多模態大模型迭代而來。
Step-1V大模型已經可以精準描述和理解圖像中的文字、數據、圖表等信息,并根據圖像信息實現內容創作、邏輯推理、數據分析等多項任務。
而視頻中的內容,它也可以輕松理解。
對比前作,Step-1.5V多模態大模型有明顯躍升。
- 感知能力:創新的圖文混排訓練方法,讓Step-1.5V能理解復雜圖表、流程圖、準確感知物理空間復雜的幾何位置,還能夠處理高分辨率和極限長寬比的圖像。
- 推理能力:根據圖像內容進行各類高級推理任務,如解答數學題、編寫代碼、創作詩歌等。
- 視頻理解能力:它不僅能夠準確識別視頻中的物體、人物和環境,還能夠理解視頻的整體氛圍和人物情緒。
另一個新發布的Step-1X圖像生成大模型,有600M、2B、8B三種參數量,分別適合對于速度敏感、日常主力(平衡效果和速度)、追求更高效更極致這三種場景。
通過全鏈路自研的DiT模型架構,Step-1X有更好的文本prompt和生成圖片的語義對齊能力,以及指令跟隨能力。
還有個不得不提的點:
Step-1X針對中國元素進行了深度優化,有關中國元素、文化的內容都能輕松拿下,生成的效果也更符合國人審美。

對外亮相第一天起,階躍星辰就擺明姿態,攀登AGI巔峰之路“萬億參數”和“多模融合”缺一不可。
這次一股腦兒推出的三款新模型,就是其在既定路線上向前探索的有力證明。
不可或缺的AI應用與生態布局
階躍星辰不是WAIC上唯一推陳出新的大模型玩家。
在現場有一種強烈的感受,相比去年WAIC,展區的大模型廠商出現了更多創業公司的身影,尤為不同的是,無論是展商、論壇還是觀眾,對AI大模型應用的關注和討論都占去不小篇幅。
類似“模應一體”“殺手級應用”“AI應用生態”這般的話題,頻頻被提起。
姜大昕此前有過一個生動的比喻:模型和產品的關系,就像靈魂和皮囊。
當你具體到某個應用的時候一定要通用模型跟它深度綁定,應用才能做到極致。
反過來也是一樣,我不覺得一個光做應用的公司,沒有一個模型跟它深度綁定的話,它能做到極致。
這就凸顯出階躍星辰在模型與產品之間的伏線千里之妙。
以自家Step系列模型為基座,階躍星辰的產品共有兩類,自有產品和合作產品。
自有產品方面,有聊天類應用躍問,定位個人效率助手,web端和App端可用;AI開放世界平臺冒泡鴨,提供海量智能體,主打一個休閑娛樂。
兩款toC產品,均已全面開放使用。
這里重點介紹一下躍問,它擁有聯網搜索、代碼分析增強(POT)等能力,能夠提供信息查詢、語言學習、創意寫作、圖文解讀等服務。
和其它家聊天類應用相比,它有一個最大的優勢:多模態內容理解能力。
它能夠幫助用戶識別真實世界的萬事萬物:

能夠理解和分析復雜的金融圖表:

還能理解熱梗圖片中的深意:

甚至能夠根據歐洲杯賽程表,梳理生成“一圖讀懂”:

合作產品方面,最亮眼的就是此次吸粉無數的《大鬧天宮》AI互動體驗。

動畫電影《大鬧天宮》制作于1961年,是上美影的靈魂代表作,60年來,更成為幾代人鐘愛的回憶。

半個多世紀以來,基于這個國民IP的創新層出不窮,還能玩出什么新花樣?
圍繞《大鬧天宮》,階躍團隊與上影集團利用AIGC和大模型技術,聯合推出了AI互動體驗產品,讓大家能與電影情境深度融合。
玩法也很簡單:
上傳一張個人照片,然后開始走Step系列大模型生成的劇情。

模型算法會識別照片特征,提取后結合《大鬧天宮》的畫風和角色,完成風格遷徙,生成新的肖像。

劇情發展過程中,用戶能選擇,也能和系統對話交談。

等等,這還沒完!
根據剛才做出的選擇和回答,大模型還會進一步分析用戶的MBTI人格,最后得出結論:
如果你在天庭當打工人,最適合什么差事?
(沒辦法咯,孫悟空大鬧天宮前也老老實實做了段時間弼馬溫)

量子位測出來,是enfp的赤腳大仙。
都說光腳的不怕穿鞋的,本大仙今天就原地罷工吧(不是)。
據說只有1%的人能測出來齊天大圣,不是我,我慕了。
沒在現場但想玩一把的朋友們,可點擊文末閱讀原文,也歡迎大家把測出來的MBTI和神仙職位在評論區分享~

上述產品不只是階躍星辰利用自家大模型能力對外輸出的全部。
據了解,在內容、金融、網絡文學、知識服務、影視等領域,階躍星辰都和行業頭部展開合作,多維探索面向C端用戶的創新應用。
國產大模型創業第一梯隊新格局
對于所有的大模型玩家來說,從ChatGPT誕世的那一天起,全球范圍內的競爭就愈發激烈,再也沒有停歇過。
尤其是WAIC現場,這樣的信號傳遞得非常明顯。
谷歌、Meta、BAT、華為、訊飛、深度求索、AI四小龍……老牌AI布局者,在AI 2.0時代的實力依然不可小覷。
背后原因是AI 2.0實質上是隨著研究深入,對判別式AI與生成式AI的人為劃分,而深度學習的核心三駕馬車,即對算法、算力、數據的掌握和運用,依然是重中之重。

但古今中外,一個時代有一個時代的公司,每個時代都會有代表性的公司出現。
AI 2.0時代的大模型初創公司,確實已經出現了對技術和產業的發展至關重要的銳力。
WAIC展區,就有這樣的玩家出現,而且經過第一階段的競速和洗牌,大模型創業的上半場基本已經結束。
在上半場中,能夠脫穎而出的創業玩家,首先通過自研基礎大模型,證明了自己的技術研發實力;其次還通過產品和應用,開啟了商業模式試水,構建起了技術-產品-數據-商用的初步飛輪;最后,還獲得了創投和資本市場的認證,完成了獨角獸級別的巨額融資,有糧草和底氣可以開啟下一階段比拼。
實際上,上半場也是創業玩家的分水嶺,能夠在此時此刻把公司推至獨角獸級別,是角逐下半場的門票體現。
也就是說,沒有門票,基本就告別下半場了,更別說AGI了。
因為隨著第一階段競速,市場的作用開始展現,不論是技術人才、研發資源、創投資本,都在急劇收斂,形成馬太效應——留在桌上的玩家會獲得更多的資源挑戰更大的目標,下了桌的玩家,原先有的也要被拿回。
互聯網時代、移動互聯網時代、AI1.0時代的軌跡,再次重復上演。
而現在,在AI2.0上半場拿到門票的創業玩家,格局初現,六小強銳不可當——
智譜華章、月之暗面、MiniMax、零一萬物、百川智能、階躍星辰……越來越多被放在一起談論。
而階躍星辰,是其中后發的一個,但正在展現出謀定而后動的后發優勢。
而且它是為數不多,在國內同時擁有多模態大模型能力和萬億MoE大模型的玩家,這代表了面向下半場的某種潛在競爭力和加速度來源。
- 讀懂2025中國AI走向!公司×產品×人物×方案,最值得關注的都在這里了2025-12-10
- 誤入人均10個頂級offer的技術天團活動,頂尖AI人才的選擇邏輯我悟了2025-12-04
- DeepSeek-V3.2系列開源,性能直接對標Gemini-3.0-Pro2025-12-01
- 字節“豆包手機”剛開賣,吉利系進展也曝光了:首月速成200人團隊,挖遍華為小米榮耀2025-12-01




