實測Kimi全新Agent模型「OK Computer」,很OK
搜索、設(shè)計、生成、分析全包辦
聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
Kimi發(fā)布全新Agent模型OK Computer?!

看來各大廠商卷Agent的節(jié)奏愈演愈烈了(doge)。
Kimi家的這個依托Kimi K2,能搭網(wǎng)站、能做PPT、還能處理100萬行數(shù)據(jù)生成交互式儀表板。

這個新Agent名字好像還有點兒來頭啊……
別的先不說,OK Computer到底OK不OK?實測一下!
效果展示
首先,模型界面設(shè)計沾一些像素風(fēng),簡潔可愛。

設(shè)計類任務(wù)
那就先來試一下設(shè)計類的網(wǎng)頁制作功能,實際上這個實測任務(wù)考察了網(wǎng)頁制作+python編程兩項能力。
提示詞是:
展示一個優(yōu)秀的Pygame網(wǎng)頁
粗看一下最終效果,網(wǎng)頁包含的內(nèi)容有Pygame的發(fā)展歷程、游戲展示(可以試玩)、核心特性、開發(fā)教程這幾個模塊,但要說明的是,這些模塊并不是在提示詞中要求的,而是全由模型自己設(shè)計并實現(xiàn)。

再細(xì)看的話,網(wǎng)頁中的按鈕大部分可以跳轉(zhuǎn),游戲展示和學(xué)習(xí)教程部分還做了等級分類、對比可視化、樣例展示等功能。


雖然不是每一個游戲都能點開玩,但由于提示詞只有一句話,能得到這個效果已經(jīng)非常不錯了。
看完效果來看一下模型是如何完成這個網(wǎng)頁制作任務(wù)的。
首先是列一個Todo List,每完成一項進(jìn)度都會在表中進(jìn)行標(biāo)記,比如“x”表示已經(jīng)完成,“-”表示正在進(jìn)行,可以供用戶查看任務(wù)進(jìn)程。

在實際操作中,模型可以在需要的情況下自主完成網(wǎng)頁搜索、素材生成等前期規(guī)劃。


素材準(zhǔn)備完成后 ,來到網(wǎng)頁制作的編程環(huán)節(jié),同樣是自主設(shè)計自動檢查。

由于沒有終端權(quán)限,模型自動改為靜態(tài)部署。部署完成后的最終的預(yù)覽效果就是上述展示的那樣~

生成類任務(wù)
看完編程能力,再來看看生成能力吧,這項實測包含文本生成+圖像生成+音頻生成三個任務(wù)。
提示詞是:
請你編寫一個兒童故事,并且將故事可視化成一個繪本。

其實,最初只是想生成繪本,但突然想測試一下模型的音頻生成功能,于是這項任務(wù)的就分了兩個階段。

經(jīng)過一番編故事、生成圖片、繪本設(shè)計、音頻生成、匹配部署…操作后,最終的效果為:
除此之外,大家最常用的PPT制作,也幫大家測了一把。
提示詞是:
請你做一個PPT文件展示中國十大原創(chuàng)優(yōu)秀音樂劇,里面主要展示劇照和故事情節(jié),要有文藝氣息。

這次就直接輸出了可供編輯的PPT文件。

幫大家試過了,是真的可編輯(doge)。

but第6-10部怎么偷懶不做了……

分析類任務(wù)
大家做分析任務(wù)最頭疼的估計就是長文檔檢索和大量數(shù)據(jù)分析了,那我們就來測一測這兩項。
但是手頭沒有數(shù)據(jù)怎么辦?讓Agent把搜集數(shù)據(jù)和分析數(shù)據(jù)包辦!

提示詞是:
查找一下月之暗面2025年財務(wù)數(shù)據(jù),分析數(shù)據(jù)并可視化。

最終效果為:

最后也上傳了本地文件測試,excel表格又臭又長的數(shù)據(jù)也一目了然。
提示詞是:
分析表格數(shù)據(jù)并可視化。

實測下來的感受是:設(shè)計類任務(wù)不需要自己找素材,分析類任務(wù)不需要自己想評估角度,生成類任務(wù)還能幫你推薦風(fēng)格。
感覺很OK。
One More Thing
“OK Computer,我現(xiàn)在要全權(quán)掌控。”
在《銀河系漫游指南》中,人類這樣宣布從機(jī)器手中奪回掌控權(quán)。
但現(xiàn)在,再談到“OK Computer”居然來了個反轉(zhuǎn)——
你的Computer要被AI“掌控”嘍(doge)~
所以,有朋友也上手玩了嗎?覺得O不OK?



