楊植麟被梁文鋒叫醒了！Kimi新模型發(fā)布即開源，1T參數(shù)全線SOTA

魚羊 2025-07-12 13:21:24 來源：量子位

1T MoE，激活參數(shù)32B，128K上下文

魚羊雷剛發(fā)自紐凹非寺

量子位 | 公眾號(hào) QbitAI

172天過去，Kimi在深夜低調(diào)給出了DeepSeek沖擊波后的回應(yīng)。

全新Kimi K2基礎(chǔ)大模型，MoE架構(gòu)，總參數(shù)1T，激活參數(shù)32B，能力領(lǐng)先性尤其展現(xiàn)在代碼、Agent、數(shù)學(xué)推理任務(wù)上。

Kimi援引多個(gè)基準(zhǔn)評(píng)測(cè)數(shù)據(jù)，創(chuàng)造了開源全新SOTA。

沒錯(cuò)，Kimi K2，這次發(fā)布即開源。

并且Web端、App和API服務(wù)都同步上線可以使用。

作為DeepSeek R1發(fā)布后最大的“被沖擊者”，Kimi這半年幾乎遭遇到了全方位質(zhì)疑：技術(shù)領(lǐng)先性還有嗎？營銷投流意義幾何？以及之前非技術(shù)花邊纏身——Kimi還有技術(shù)信仰嗎？

172天后，Kimi在深夜用K2大模型給出了低調(diào)但明確的回應(yīng)：

游戲尚未結(jié)束，Kimi不下牌桌，Kimi不打算認(rèn)輸。

楊植麟算是被廣東大哥梁文鋒叫醒了。

Kimi K2：1T參數(shù)MoE基礎(chǔ)模型

先來看Kimi K2的具體情況。

作為Kimi最新MoE基礎(chǔ)模型，Kimi K2強(qiáng)調(diào)的是代碼能力和通用Agent任務(wù)能力。

總參數(shù)量達(dá)到1T…屬實(shí)是讓本地部署黨捏了把汗，不過激活參數(shù)是32B。

支持128K上下文。

而蟄伏許久，一上新又直接是一個(gè)開源的大動(dòng)作，Kimi此番就是奔著SOTA來的。

在SWE Bench Verified、Tau2、AceBench等基準(zhǔn)性能測(cè)試中，Kimi K2均取得開源模型中的SOTA成績。

Agent和編程能力：

楊植麟被梁文鋒叫醒了！Kimi新模型發(fā)布即開源，1T參數(shù)全線SOTA

工具調(diào)用能力：

數(shù)學(xué)等科學(xué)能力：

官方Demo，也把大家現(xiàn)在最關(guān)心的一些模型能力，直觀展示了出來。

代碼能力提升

在前端開發(fā)任務(wù)中，Kimi K2支持粒子系統(tǒng)、可視化和3D場(chǎng)景等表現(xiàn)形式。

可以生成支持晝夜循環(huán)的山川峽谷3D景觀。

3D粒子星系模擬的效果也很出色：

Agent工具調(diào)用能力提升

Kimi K2具備穩(wěn)定的復(fù)雜指令解析能力，可將需求自動(dòng)拆解為一系列格式規(guī)范、可以直接執(zhí)行的ToolCall結(jié)構(gòu)。

比如，一站式幫你追星（doge）。

全年追星計(jì)劃，演唱會(huì)機(jī)酒和旅行規(guī)劃它都能幫忙做，還能生成日歷，用html概括完整行程規(guī)劃并給你發(fā)送郵件。

上線即開源

此次Kimi K2討論度最高的一點(diǎn)，就是Kimi果斷走了開源路線。

開源的模型版本有兩個(gè)：

Kimi-K2-Base：未經(jīng)過指令微調(diào)的基礎(chǔ)預(yù)訓(xùn)練模型，適合科研與自定義場(chǎng)景；
Kimi-K2-Instruct：通用指令微調(diào)版本（非思考模型），在大多數(shù)問答與Agent任務(wù)中表現(xiàn)卓越。

遵循的是修改版MIT協(xié)議（Modified MIT License）。

MIT協(xié)議可以說是最寬松的協(xié)議（約等于怎么用都行）。而Kimi的修改在于，如果基于Kimi K2打造的產(chǎn)品或服務(wù)月活躍用戶超過1億，或者月收入超過2000萬美元，那么需要在該產(chǎn)品和服務(wù)的用戶界面上顯示“Kimi K2”。

技術(shù)細(xì)節(jié)

此外值得關(guān)注的是，Kimi官方此次也分享了不少技術(shù)細(xì)節(jié)。

其中關(guān)鍵的技術(shù)創(chuàng)新有三點(diǎn)：

MuonClip優(yōu)化器

Kimi K2拋棄了傳統(tǒng)的Adam優(yōu)化器，創(chuàng)新性地使用了Muon優(yōu)化器。

為了緩解大規(guī)模訓(xùn)練中的attention logits偏大問題，他們提出MuonClip，并將其擴(kuò)展到萬億參數(shù)規(guī)模，提升了訓(xùn)練穩(wěn)定性和token使用效率。

Kimi K2完成了15.5T token的平穩(wěn)訓(xùn)練，全程無loss spike。

大規(guī)模Agentic Tool Use數(shù)據(jù)合成

Kimi K2構(gòu)建了可大規(guī)模生成多輪工具使用場(chǎng)景的合成pipeline，覆蓋數(shù)百領(lǐng)域、數(shù)千工具。高質(zhì)量樣本由LLM評(píng)估篩選后用于訓(xùn)練。

通用強(qiáng)化學(xué)習(xí)

Kimi K2不僅在可驗(yàn)證任務(wù)上（代碼、數(shù)學(xué)）強(qiáng)化學(xué)習(xí)，還通過引入自我評(píng)價(jià)機(jī)制（self-judging），解決了不可驗(yàn)證任務(wù)的獎(jiǎng)勵(lì)稀缺問題。通過可驗(yàn)證任務(wù)持續(xù)優(yōu)化critic，提升泛化任務(wù)表現(xiàn)。

實(shí)測(cè)

模型一官宣，Kimi官網(wǎng)和App已經(jīng)實(shí)裝。

效果究竟有沒有官方說的那么好，我們上手實(shí)測(cè)驗(yàn)證了一波。

先熱熱身，讓Kimi給Kimi K2做個(gè)宣傳網(wǎng)頁。

提示詞很簡單，同時(shí)打開聯(lián)網(wǎng)搜索：

Kimi K2發(fā)布并開源，做一個(gè)宣傳網(wǎng)頁。

審美屬于是簡潔掛的。比較有意思的是，其中“立即體驗(yàn)”和“下載開源模型”按鈕，都是真的可以跳轉(zhuǎn)到正確網(wǎng)址的。

再加上一點(diǎn)物理模擬試試：

模擬高爾頓板，UI設(shè)計(jì)得好看一點(diǎn)。

這個(gè)UI確實(shí)不錯(cuò)。另外在提示詞沒有給出具體要求的情況下，Kimi K2貼心地自動(dòng)設(shè)計(jì)了行數(shù)和小球數(shù)量的調(diào)整滑桿。

不過小球下落的動(dòng)畫還有優(yōu)化空間。

可以看到，即使提示詞很簡單，Kimi K2也能理解到位，寫出效果相當(dāng)不錯(cuò)的代碼。

那么如果讓Kimi K2擔(dān)當(dāng)私人助理，幫忙做做計(jì)劃，效果又會(huì)如何？

提示詞：

我想去看林俊杰的演唱會(huì)，在東亞地區(qū)的都可以，幫我安排一份觀演計(jì)劃，包括機(jī)酒和行程規(guī)劃。

乍一看還挺清晰的，但橋豆麻袋……

選的都是過期場(chǎng)次，并沒有什么參考價(jià)值。

不過從官方的說法來看，這可能和工具調(diào)用功能還沒正式上線有關(guān)。

無論如何，K2的性能成績和體驗(yàn)，還是展現(xiàn)了Kimi一鳴驚人時(shí)的水準(zhǔn)。

曾經(jīng)的Kimi，正在回歸。

DeepSeek沖擊波172天之后，Kimi的回應(yīng)

種種跡象表明，Kimi K2帶著誠意，也帶著王者回歸的復(fù)仇情緒。

172天之前，2025年春節(jié)之前，Kimi曾是國產(chǎn)基礎(chǔ)大模型中最受關(guān)注的一個(gè)，團(tuán)隊(duì)青春風(fēng)暴，產(chǎn)品體驗(yàn)優(yōu)雅。

據(jù)量子位智庫統(tǒng)計(jì)數(shù)據(jù)，在2024年全年數(shù)據(jù)，AI智能助手Web端市場(chǎng)格局已經(jīng)相對(duì)穩(wěn)定，特別是頭部，形成了Kimi智能助手、豆包AI和文心一言的TOP 3格局，占據(jù)70%市場(chǎng)份額。

而Kimi更是以創(chuàng)業(yè)獨(dú)角獸姿態(tài)，青春風(fēng)暴，銳不可當(dāng)。

在APP端，這種態(tài)勢(shì)就更明確，豆包和Kimi智能助手幾乎斷崖式領(lǐng)先其他玩家，各維度數(shù)據(jù)占比市場(chǎng)份額80%。幾乎就是雙寡頭。

但這種數(shù)據(jù)上的優(yōu)勢(shì)，在2025年1月20日迎來暴擊。

因?yàn)檎沁@一天，DeepSeek R1橫空出世，迅速引爆國內(nèi)外，并在春節(jié)假期中，形成了全民話題。

在AI領(lǐng)域一直伺機(jī)而動(dòng)的巨頭騰訊，也行動(dòng)迅速，借助DeepSeek的開源大旗，猛虎下山。

穩(wěn)固的格局，一夜巨變。

所以半年之后，AI智能助手什么光景？

量子位智庫最新的2025上半年數(shù)據(jù)顯示，Web端和App端，頭部格局都變成了DDKT，占據(jù)90%市場(chǎng)份額。

所謂DDTK，就是字節(jié)豆包、DeepSeek、Kimi、騰訊元寶。

Kimi依然在牌桌，然而危機(jī)的警報(bào)已經(jīng)內(nèi)外都能感知，增長之外的留存活躍，更是風(fēng)聲鶴唳。

因?yàn)镵imi的數(shù)據(jù)增長地位，跟其之前拿著巨額融資后燒錢投流的策略密不可分，然而如果DeepSeek和騰訊元寶，可以靠著先進(jìn)模型就能快速突破，那這壁壘又何在？這燒錢投流的正當(dāng)性又何在？

更何況在DDTK中，Kimi是唯一的沒有現(xiàn)金奶牛支撐的創(chuàng)業(yè)公司。

數(shù)據(jù)層面的體現(xiàn)，恐怕只是Kimi、月之暗面這半年來宏觀壓力下的質(zhì)疑之一……

更根本性的質(zhì)疑則直接關(guān)乎生死存亡——

DeepSeek之后，還需要自研基礎(chǔ)大模型重復(fù)造輪子嗎？

DeepSeek的沖擊，不僅是先進(jìn)技術(shù)模型的沖擊，更是開源對(duì)閉源的沖擊。

如果市面上已經(jīng)有如此全方位開源的領(lǐng)先模型，為什么其他公司特別是創(chuàng)業(yè)公司，還有合理的融資理由去推進(jìn)自研基礎(chǔ)大模型的故事？

至少在DeepSeek之后，曾經(jīng)包含Kimi在內(nèi)的AI大模型“六小龍”創(chuàng)業(yè)格局，已經(jīng)一夜分崩，有至少2家放棄了大模型自研。

于是這172天之中，Kimi上上下下也好，CEO楊植麟也好，一定被不斷問及這個(gè)質(zhì)疑：

Kimi如何回應(yīng)？Kimi往何處去？

現(xiàn)在，楊植麟從輿論里消失172天之后，Kimi用K2開源基礎(chǔ)大模型給出了最明確的回應(yīng)——

Kimi不認(rèn)輸，Kimi不會(huì)放棄自研大模型。

Kimi的路徑也已經(jīng)明牌——

打造更強(qiáng)的開源大模型，全維度SOTA，重新證明技術(shù)的領(lǐng)先性。

某種程度來說，梁文鋒不光叫醒了老鄉(xiāng)小弟楊植麟，更幫他重新找回了競逐AGI的初心。

— 完 —

版權(quán)所有，未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用，違者必究。

Kimi Kimi K2

魚羊

楊植麟被梁文鋒叫醒了！Kimi新模型發(fā)布即開源，1T參數(shù)全線SOTA

Kimi K2：1T參數(shù)MoE基礎(chǔ)模型

實(shí)測(cè)

DeepSeek沖擊波172天之后，Kimi的回應(yīng)

相關(guān)閱讀

Kimi論文自曝推理架構(gòu)，80%流量都靠它承擔(dān)

比0.99元羊毛更重要的，是跟AI砍價(jià)的快樂

楊植麟發(fā)布Kimi新模型：數(shù)學(xué)對(duì)標(biāo)o1，中考高考考研成績?nèi)谝?/a>

剛剛，Kimi開源底層推理框架，1小時(shí)GitHub攬星1.2k

Kimi K2 Thinking突襲！智能體&推理能力超GPT-5，網(wǎng)友：再次縮小開源閉源差距

DeepSeek終于丟了開源第一王座，但繼任者依然來自中國

熱門文章

DeepSeek-V3.2系列開源，性能直接對(duì)標(biāo)Gemini-3.0-Pro

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創(chuàng) 語音交互新范式

商湯分拆了一家AI醫(yī)療公司，半年融資10億，劍指“醫(yī)療世界模型”

前端沒死，AI APP正在返祖

寧德時(shí)代給9萬+基層員工漲了薪！每月150元