楊植麟被梁文鋒叫醒了!Kimi新模型發(fā)布即開源,1T參數(shù)全線SOTA
1T MoE,激活參數(shù)32B,128K上下文
魚羊 雷剛 發(fā)自 紐凹非寺
量子位 | 公眾號(hào) QbitAI
172天過去,Kimi在深夜低調(diào)給出了DeepSeek沖擊波后的回應(yīng)。
全新Kimi K2基礎(chǔ)大模型,MoE架構(gòu),總參數(shù)1T,激活參數(shù)32B,能力領(lǐng)先性尤其展現(xiàn)在代碼、Agent、數(shù)學(xué)推理任務(wù)上。
Kimi援引多個(gè)基準(zhǔn)評(píng)測(cè)數(shù)據(jù),創(chuàng)造了開源全新SOTA。
沒錯(cuò),Kimi K2,這次發(fā)布即開源。
并且Web端、App和API服務(wù)都同步上線可以使用。
作為DeepSeek R1發(fā)布后最大的“被沖擊者”,Kimi這半年幾乎遭遇到了全方位質(zhì)疑:技術(shù)領(lǐng)先性還有嗎?營銷投流意義幾何?以及之前非技術(shù)花邊纏身——Kimi還有技術(shù)信仰嗎?
172天后,Kimi在深夜用K2大模型給出了低調(diào)但明確的回應(yīng):
游戲尚未結(jié)束,Kimi不下牌桌,Kimi不打算認(rèn)輸。
楊植麟算是被廣東大哥梁文鋒叫醒了。
Kimi K2:1T參數(shù)MoE基礎(chǔ)模型
先來看Kimi K2的具體情況。
作為Kimi最新MoE基礎(chǔ)模型,Kimi K2強(qiáng)調(diào)的是代碼能力和通用Agent任務(wù)能力。
總參數(shù)量達(dá)到1T…屬實(shí)是讓本地部署黨捏了把汗,不過激活參數(shù)是32B。
支持128K上下文。
而蟄伏許久,一上新又直接是一個(gè)開源的大動(dòng)作,Kimi此番就是奔著SOTA來的。
在SWE Bench Verified、Tau2、AceBench等基準(zhǔn)性能測(cè)試中,Kimi K2均取得開源模型中的SOTA成績。
Agent和編程能力:

工具調(diào)用能力:

數(shù)學(xué)等科學(xué)能力:

官方Demo,也把大家現(xiàn)在最關(guān)心的一些模型能力,直觀展示了出來。
代碼能力提升
在前端開發(fā)任務(wù)中,Kimi K2支持粒子系統(tǒng)、可視化和3D場(chǎng)景等表現(xiàn)形式。
可以生成支持晝夜循環(huán)的山川峽谷3D景觀。
3D粒子星系模擬的效果也很出色:

Agent工具調(diào)用能力提升
Kimi K2具備穩(wěn)定的復(fù)雜指令解析能力,可將需求自動(dòng)拆解為一系列格式規(guī)范、可以直接執(zhí)行的ToolCall結(jié)構(gòu)。
比如,一站式幫你追星(doge)。
全年追星計(jì)劃,演唱會(huì)機(jī)酒和旅行規(guī)劃它都能幫忙做,還能生成日歷,用html概括完整行程規(guī)劃并給你發(fā)送郵件。
上線即開源
此次Kimi K2討論度最高的一點(diǎn),就是Kimi果斷走了開源路線。
開源的模型版本有兩個(gè):
- Kimi-K2-Base:未經(jīng)過指令微調(diào)的基礎(chǔ)預(yù)訓(xùn)練模型,適合科研與自定義場(chǎng)景;
- Kimi-K2-Instruct:通用指令微調(diào)版本(非思考模型),在大多數(shù)問答與Agent任務(wù)中表現(xiàn)卓越。
遵循的是修改版MIT協(xié)議(Modified MIT License)。
MIT協(xié)議可以說是最寬松的協(xié)議(約等于怎么用都行)。而Kimi的修改在于,如果基于Kimi K2打造的產(chǎn)品或服務(wù)月活躍用戶超過1億,或者月收入超過2000萬美元,那么需要在該產(chǎn)品和服務(wù)的用戶界面上顯示“Kimi K2”。
技術(shù)細(xì)節(jié)
此外值得關(guān)注的是,Kimi官方此次也分享了不少技術(shù)細(xì)節(jié)。
其中關(guān)鍵的技術(shù)創(chuàng)新有三點(diǎn):
- MuonClip優(yōu)化器
Kimi K2拋棄了傳統(tǒng)的Adam優(yōu)化器,創(chuàng)新性地使用了Muon優(yōu)化器。
為了緩解大規(guī)模訓(xùn)練中的attention logits偏大問題,他們提出MuonClip,并將其擴(kuò)展到萬億參數(shù)規(guī)模,提升了訓(xùn)練穩(wěn)定性和token使用效率。
Kimi K2完成了15.5T token的平穩(wěn)訓(xùn)練,全程無loss spike。
- 大規(guī)模Agentic Tool Use數(shù)據(jù)合成
Kimi K2構(gòu)建了可大規(guī)模生成多輪工具使用場(chǎng)景的合成pipeline,覆蓋數(shù)百領(lǐng)域、數(shù)千工具。高質(zhì)量樣本由LLM評(píng)估篩選后用于訓(xùn)練。

- 通用強(qiáng)化學(xué)習(xí)
Kimi K2不僅在可驗(yàn)證任務(wù)上(代碼、數(shù)學(xué))強(qiáng)化學(xué)習(xí),還通過引入自我評(píng)價(jià)機(jī)制(self-judging),解決了不可驗(yàn)證任務(wù)的獎(jiǎng)勵(lì)稀缺問題。通過可驗(yàn)證任務(wù)持續(xù)優(yōu)化critic,提升泛化任務(wù)表現(xiàn)。
實(shí)測(cè)
模型一官宣,Kimi官網(wǎng)和App已經(jīng)實(shí)裝。
效果究竟有沒有官方說的那么好,我們上手實(shí)測(cè)驗(yàn)證了一波。
先熱熱身,讓Kimi給Kimi K2做個(gè)宣傳網(wǎng)頁。
提示詞很簡單,同時(shí)打開聯(lián)網(wǎng)搜索:
Kimi K2發(fā)布并開源,做一個(gè)宣傳網(wǎng)頁。

審美屬于是簡潔掛的。比較有意思的是,其中“立即體驗(yàn)”和“下載開源模型”按鈕,都是真的可以跳轉(zhuǎn)到正確網(wǎng)址的。

再加上一點(diǎn)物理模擬試試:
模擬高爾頓板,UI設(shè)計(jì)得好看一點(diǎn)。

這個(gè)UI確實(shí)不錯(cuò)。另外在提示詞沒有給出具體要求的情況下,Kimi K2貼心地自動(dòng)設(shè)計(jì)了行數(shù)和小球數(shù)量的調(diào)整滑桿。
不過小球下落的動(dòng)畫還有優(yōu)化空間。

可以看到,即使提示詞很簡單,Kimi K2也能理解到位,寫出效果相當(dāng)不錯(cuò)的代碼。
那么如果讓Kimi K2擔(dān)當(dāng)私人助理,幫忙做做計(jì)劃,效果又會(huì)如何?
提示詞:
我想去看林俊杰的演唱會(huì),在東亞地區(qū)的都可以,幫我安排一份觀演計(jì)劃,包括機(jī)酒和行程規(guī)劃。

乍一看還挺清晰的,但橋豆麻袋……
選的都是過期場(chǎng)次,并沒有什么參考價(jià)值。

不過從官方的說法來看,這可能和工具調(diào)用功能還沒正式上線有關(guān)。
無論如何,K2的性能成績和體驗(yàn),還是展現(xiàn)了Kimi一鳴驚人時(shí)的水準(zhǔn)。
曾經(jīng)的Kimi,正在回歸。
DeepSeek沖擊波172天之后,Kimi的回應(yīng)
種種跡象表明,Kimi K2帶著誠意,也帶著王者回歸的復(fù)仇情緒。
172天之前,2025年春節(jié)之前,Kimi曾是國產(chǎn)基礎(chǔ)大模型中最受關(guān)注的一個(gè),團(tuán)隊(duì)青春風(fēng)暴,產(chǎn)品體驗(yàn)優(yōu)雅。
據(jù)量子位智庫統(tǒng)計(jì)數(shù)據(jù),在2024年全年數(shù)據(jù),AI智能助手Web端市場(chǎng)格局已經(jīng)相對(duì)穩(wěn)定,特別是頭部,形成了Kimi智能助手、豆包AI和文心一言的TOP 3格局,占據(jù)70%市場(chǎng)份額。

而Kimi更是以創(chuàng)業(yè)獨(dú)角獸姿態(tài),青春風(fēng)暴,銳不可當(dāng)。
在APP端,這種態(tài)勢(shì)就更明確,豆包和Kimi智能助手幾乎斷崖式領(lǐng)先其他玩家,各維度數(shù)據(jù)占比市場(chǎng)份額80%。幾乎就是雙寡頭。
但這種數(shù)據(jù)上的優(yōu)勢(shì),在2025年1月20日迎來暴擊。
因?yàn)檎沁@一天,DeepSeek R1橫空出世,迅速引爆國內(nèi)外,并在春節(jié)假期中,形成了全民話題。
在AI領(lǐng)域一直伺機(jī)而動(dòng)的巨頭騰訊,也行動(dòng)迅速,借助DeepSeek的開源大旗,猛虎下山。
穩(wěn)固的格局,一夜巨變。
所以半年之后,AI智能助手什么光景?
量子位智庫最新的2025上半年數(shù)據(jù)顯示,Web端和App端,頭部格局都變成了DDKT,占據(jù)90%市場(chǎng)份額。
所謂DDTK,就是字節(jié)豆包、DeepSeek、Kimi、騰訊元寶。
Kimi依然在牌桌,然而危機(jī)的警報(bào)已經(jīng)內(nèi)外都能感知,增長之外的留存活躍,更是風(fēng)聲鶴唳。

因?yàn)镵imi的數(shù)據(jù)增長地位,跟其之前拿著巨額融資后燒錢投流的策略密不可分,然而如果DeepSeek和騰訊元寶,可以靠著先進(jìn)模型就能快速突破,那這壁壘又何在?這燒錢投流的正當(dāng)性又何在?
更何況在DDTK中,Kimi是唯一的沒有現(xiàn)金奶牛支撐的創(chuàng)業(yè)公司。
數(shù)據(jù)層面的體現(xiàn),恐怕只是Kimi、月之暗面這半年來宏觀壓力下的質(zhì)疑之一……
更根本性的質(zhì)疑則直接關(guān)乎生死存亡——
DeepSeek之后,還需要自研基礎(chǔ)大模型重復(fù)造輪子嗎?
DeepSeek的沖擊,不僅是先進(jìn)技術(shù)模型的沖擊,更是開源對(duì)閉源的沖擊。
如果市面上已經(jīng)有如此全方位開源的領(lǐng)先模型,為什么其他公司特別是創(chuàng)業(yè)公司,還有合理的融資理由去推進(jìn)自研基礎(chǔ)大模型的故事?
至少在DeepSeek之后,曾經(jīng)包含Kimi在內(nèi)的AI大模型“六小龍”創(chuàng)業(yè)格局,已經(jīng)一夜分崩,有至少2家放棄了大模型自研。
于是這172天之中,Kimi上上下下也好,CEO楊植麟也好,一定被不斷問及這個(gè)質(zhì)疑:
Kimi如何回應(yīng)?Kimi往何處去?
現(xiàn)在,楊植麟從輿論里消失172天之后,Kimi用K2開源基礎(chǔ)大模型給出了最明確的回應(yīng)——
Kimi不認(rèn)輸,Kimi不會(huì)放棄自研大模型。
Kimi的路徑也已經(jīng)明牌——
打造更強(qiáng)的開源大模型,全維度SOTA,重新證明技術(shù)的領(lǐng)先性。
某種程度來說,梁文鋒不光叫醒了老鄉(xiāng)小弟楊植麟,更幫他重新找回了競逐AGI的初心。
— 完 —




