人人都可擁有的自主性AI:有記憶會(huì)使用工具,還會(huì)自我學(xué)習(xí)!底層自研框架即將開(kāi)源
AI超級(jí)助手離我們更近了
明敏 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
要說(shuō)AutoGPT為啥會(huì)迅速躥紅?
還不是把人類對(duì)AI的想象力再次打開(kāi)了。
使喚AI不用再一句句引導(dǎo),更不用去研究提示工程了。
人人像鋼鐵俠那樣擁有超級(jí)AI賈維斯不是夢(mèng)。

而就在現(xiàn)在,這種Auto AI Copilot已經(jīng)有人批量生產(chǎn)了。
大概畫(huà)風(fēng)be like:
如果你正在瀏覽旅行APP打算訂酒店,點(diǎn)一下AI助手,它就會(huì)根據(jù)自己掌握的信息貼心發(fā)出詢問(wèn):
我記得你說(shuō)打算去新加坡旅游來(lái)著,有什么需要我?guī)兔Φ膯幔?/p>

然后對(duì)著手機(jī)說(shuō)出自己的情況和需求,它立馬找出了13個(gè)方案,并且給出自己最推薦的選擇。

不僅如此,它還會(huì)查詢當(dāng)?shù)靥鞖馓嵝涯阋獪?zhǔn)備什么衣服,并能根據(jù)天氣情況來(lái)規(guī)劃路線。整個(gè)過(guò)程,完全就是和真人助理對(duì)話的感覺(jué)啊。
除了旅行APP,如購(gòu)物、家裝等各類軟件里都能內(nèi)置這樣一個(gè)AI。而且官方還透露說(shuō),底層平臺(tái)將會(huì)在近期開(kāi)源。
這就讓人好奇了,到底這些AI從哪里來(lái)?
生產(chǎn)有記憶會(huì)自學(xué)習(xí)的AI Copilot
如上看到的AI Copilot來(lái)自名為MindOS的AGI應(yīng)用助手平臺(tái)。
它主打的功能就是為各類軟件打造一個(gè)超級(jí)AI,不光能回答人類用戶提出的問(wèn)題,還擁有記憶、自主學(xué)習(xí)能力,同時(shí)也能有個(gè)性。
比如當(dāng)你打開(kāi)家裝軟件準(zhǔn)備再買點(diǎn)裝飾,但其實(shí)沒(méi)想好具體買什么時(shí),AI Copilot就能根據(jù)它對(duì)你的了解,給出推薦的物品。


除了推薦好物,AI Copilot還能基于人類的問(wèn)題揣測(cè)意圖。
比如讓它查詢下買的桌子椅子發(fā)貨了沒(méi)有,AI先是回答了物流的進(jìn)度,然后感覺(jué)到人類可能希望桌椅能一起送過(guò)來(lái),就馬上提出了自己的猜測(cè)。
人類:我的訂單到哪了?
AI Copilot:嗨,你的訂單已經(jīng)由DHL快遞發(fā)出了,預(yù)計(jì)在今天下午7點(diǎn)送到。
人類:椅子和桌子是配套一起送過(guò)來(lái)的嗎?
AI Copilt:它們是分開(kāi)賣的。你有4把椅子會(huì)在今天送到。你是想今天也收到桌子,這樣周六就能有一整套了是嗎?
人類:是的,我能取消訂單然后重新下單一整套嗎?
而且它還會(huì)智能地根據(jù)情況給出推薦的解決辦法。
比如告訴人類,已經(jīng)發(fā)貨的椅子沒(méi)法取消訂單了。與其現(xiàn)在把椅子退貨再重新下單一整套桌椅,倒不如直接再買張桌子補(bǔ)齊吧。

據(jù)了解,MindOS平臺(tái)現(xiàn)在支持包括中英文在內(nèi)的30種語(yǔ)言,提供超過(guò)1000個(gè)帶有性格、功能的預(yù)置AI角色,準(zhǔn)確推斷意圖的準(zhǔn)確率達(dá)到97%。
而定制這些AI Copilot,其實(shí)并不難,不用懂算法和編程,也不用給數(shù)據(jù)打標(biāo),幾分鐘就能搞定。
平臺(tái)上有多種類型的AI助手可以選擇,包括購(gòu)物、金融、網(wǎng)站引導(dǎo)等。

選好類型后,就能開(kāi)始個(gè)性化定制了。
平臺(tái)支持接入API、數(shù)據(jù)和文檔等,并為AI助手提供了一些技能,可以按需選取使用。

然后只用自然語(yǔ)言描述,就能完成對(duì)AI助手的初始設(shè)定。
可以控制的內(nèi)容包括AI的形象、自我介紹、對(duì)話風(fēng)格、要完成哪些任務(wù)、不能做哪些事等。
整個(gè)過(guò)程就和招來(lái)一個(gè)新員工一樣,告訴它工作守則即可。

設(shè)置完成后,將平臺(tái)生成的代碼插入到網(wǎng)站或軟件中,即完成AI Copilot的接入。
據(jù)了解,MindOS其背后原理是以大模型作為底層基礎(chǔ),在此之上背后開(kāi)發(fā)團(tuán)隊(duì)搭建了一套模仿人腦宏觀架構(gòu)的自研框架UMM(Unifined Mind Model),為AI加入復(fù)雜思考、記憶、服務(wù)和更強(qiáng)的自主學(xué)習(xí)能力,讓大模型內(nèi)容更可控、能力更自主、部署更靈活、整合更深度。
其中,大模型就好比通用計(jì)算平臺(tái),類似于人類大腦的前額葉,具備很強(qiáng)的理解能力和邏輯推理能力。但人想要在現(xiàn)實(shí)世界中完成各種任務(wù),一定還需要視覺(jué)、執(zhí)行、動(dòng)機(jī)、記憶等區(qū)域的配合。
因此,UMM框架就是給大模型接入了這些能力,比如可以感知和處理多模態(tài)信息、記住專業(yè)知識(shí)、歷史信息和數(shù)據(jù)、自主學(xué)習(xí)等。以此讓AI可以完成一個(gè)長(zhǎng)鏈條任務(wù),和AutoGPT非常相似。
而且相對(duì)于AutoGPT,MindOS背后框架的自主性更高。
舉例來(lái)說(shuō),AutoGPT是在給定公開(kāi)的技能下(如搜索),自主規(guī)劃出合適的執(zhí)行計(jì)劃。
而MindOS中的AI,會(huì)在發(fā)現(xiàn)自己技能不夠用時(shí),主動(dòng)去互聯(lián)網(wǎng)上搜索新技能,自主測(cè)試、連接,并利用新學(xué)會(huì)的技能進(jìn)一步完成復(fù)雜任務(wù)。
比如當(dāng)用戶提問(wèn)“我想知道公司有哪些西雅圖的客戶?”
MindOS的AI發(fā)現(xiàn)自己現(xiàn)有能力沒(méi)法解決這一問(wèn)題,于是它就在公司網(wǎng)絡(luò)中找到了一個(gè)CRM接口(客戶信息系統(tǒng)),然后在用戶允許下自主學(xué)會(huì)如何使用,最后給出了公司的西雅圖頭部客戶和每個(gè)客戶的具體介紹。

去年11月初,MindOS發(fā)布1.0版本,比ChatGPT還早了幾周。
在經(jīng)過(guò)幾個(gè)月迭代后,在最近推出2.0版本,并將開(kāi)放一輪封測(cè),屆時(shí)可以搶先體驗(yàn)。
而且幕后團(tuán)隊(duì)透露,其底層框架UMM也會(huì)在后續(xù)開(kāi)源。
這絕對(duì)算得上是一個(gè)重磅消息了,畢竟當(dāng)下ChatGPT、AutoGPT熱度夠高,但是在使用和自主可控性上都還存在一些讓人有顧慮的方面。一個(gè)真正可商用的、成熟的AI框架,加上完整的配置平臺(tái),相信有很多人會(huì)躍躍欲試。
這不免讓人更加好奇,MindOS的背后開(kāi)發(fā)團(tuán)隊(duì)到底是何人?
前臉書(shū)高級(jí)研究科學(xué)家?guī)ш?duì)打造
MindOS來(lái)自心識(shí)宇宙,在2022年1月創(chuàng)立,定位是一家AGI公司。
公司團(tuán)隊(duì)成員來(lái)自Meta、Google、TikTok、Alibaba等,創(chuàng)立至今已獲得紅杉中國(guó)種子基金、線性資本、銀杏谷資本等頂級(jí)基金投資。
創(chuàng)始人兼CEO陶芳波,是數(shù)據(jù)挖掘和AI領(lǐng)域的熟悉面孔了。
他本科畢業(yè)于清華大學(xué),后赴伊利諾伊大學(xué)香檳分校獲得計(jì)算機(jī)科學(xué)博士學(xué)位,師從數(shù)據(jù)挖掘領(lǐng)域鼻祖韓家煒教授。
陶芳波博士先后在美國(guó)微軟研究院、Facebook Research、NASA等從事研發(fā)工作,并是阿里達(dá)摩院神經(jīng)符號(hào)實(shí)驗(yàn)室的創(chuàng)建人。其研發(fā)成果已應(yīng)用到NASA、波音公司等;搭建的Facebook大規(guī)模內(nèi)容理解平臺(tái),日均服務(wù)超過(guò)2億用戶。
此外,他還擔(dān)任了EMNLP、CIKM、ACL、SIGMOD、WWW等領(lǐng)域頂會(huì)的評(píng)審專家。

心識(shí)宇宙的創(chuàng)立契機(jī),主要有兩方面。
一方面是底層技術(shù)的驅(qū)動(dòng),另一方面是需求真實(shí)存在。
其中,從技術(shù)維度出發(fā)的思考和準(zhǔn)備,要從3年前說(shuō)起。
2020年GPT-3震撼發(fā)布,讓陶芳波看到了LLM的無(wú)限潛力。
這是第一個(gè)模型,可以一個(gè)模型完成很多復(fù)雜任務(wù),承載了人類幾乎所有知識(shí)。
當(dāng)時(shí),業(yè)內(nèi)對(duì)AGI的討論已經(jīng)不絕于耳,陶芳波同樣認(rèn)同AGI會(huì)給未來(lái)世界帶來(lái)變革。
怎么通往這里?大模型這條路已經(jīng)逐漸清晰了起來(lái)。幾年前,當(dāng)時(shí)還在研究實(shí)驗(yàn)室的團(tuán)隊(duì)就已經(jīng)開(kāi)始搭建一種AGI框架的雛形了。
他們提出的技術(shù)理解是:大模型是一種全新的計(jì)算革命,提供了一種新的通用算力資源,即可以通過(guò)自然語(yǔ)言來(lái)調(diào)取的數(shù)字腦力資源。
相比于提供“連接能力”的傳統(tǒng)算力,現(xiàn)在這種算力可以直接提供“理解和推理”能力。
但問(wèn)題是,目前這種算力依然是無(wú)差別的,和場(chǎng)景、個(gè)人需求沒(méi)有深度整合(Grounding)。而這種整合需要非常復(fù)雜的場(chǎng)景理解、個(gè)人需求理解。
因此,需要在大模型之上構(gòu)建一個(gè)有價(jià)值的調(diào)度框架,類似于新時(shí)代的操作系統(tǒng),讓這種算力不僅有理解能力,還和場(chǎng)景深度整合,可以在目標(biāo)的驅(qū)動(dòng)下獨(dú)立成長(zhǎng)和自我構(gòu)建。

而技術(shù)創(chuàng)新,還只是底層的支撐。更上一步,需要行業(yè)中有真實(shí)存在的需求。
實(shí)際上,近幾年不少軟件和應(yīng)用都傾向于為自己構(gòu)建一個(gè)AI助手。一般是一些低頻剛需APP,如銀行、政府類;以及一些信息整合、用戶決策路徑長(zhǎng)的APP,如電商、旅游類。
對(duì)于低頻剛需類APP,因?yàn)榇蜷_(kāi)頻率低,用戶對(duì)操作界面的熟悉程度不高。一旦有需求時(shí),往往要先花費(fèi)一段時(shí)間來(lái)摸索功能界面,有時(shí)甚至還得去網(wǎng)上搜教程,確實(shí)比較繁瑣。
因此,APP會(huì)傾向于加一個(gè)AI助手,讓用戶通過(guò)自然語(yǔ)言交互,就像是問(wèn)引導(dǎo)員一樣,快速完成操作。
而對(duì)于決策路徑比較長(zhǎng)的APP,一般有兩種情況。
第一,用戶還不知道自己明確需要什么。
比如下周要去參加婚禮了,該準(zhǔn)備什么樣的禮物?很多人在打開(kāi)購(gòu)物軟件時(shí)是沒(méi)有想法的,這就需要自己來(lái)搜索找靈感,到最終確定商品下單,會(huì)是一個(gè)比較長(zhǎng)的過(guò)程。
第二種情況,是用戶需要進(jìn)行復(fù)雜的貨比三家,最后才能完成消費(fèi)。
比如大到汽車、房產(chǎn),小到球鞋、護(hù)膚,購(gòu)買時(shí)不同人會(huì)優(yōu)先比對(duì)不同的規(guī)格參數(shù);或者是訂酒店,也要事先了解好多家的價(jià)格、環(huán)境、位置等信息。這類決策過(guò)程也都會(huì)比較復(fù)雜。
那么,如果有AI能夠快速整合對(duì)比信息,或者給出明確的推薦,這會(huì)提升用戶的體驗(yàn)感,也能提升平臺(tái)商家的轉(zhuǎn)化率。
由此也就不難理解,為什么心識(shí)宇宙聯(lián)合創(chuàng)始人兼COO林宋琪在創(chuàng)業(yè)初期就反復(fù)表達(dá):
所有分發(fā)都可以?AI再做?遍,所有UI都可以??然語(yǔ)?再做?遍,所有軟件(Application)都值得?虛擬??再做?遍。
不可否認(rèn),軟件AI化在最初也受到了不少來(lái)自市場(chǎng)的質(zhì)疑。但隨著OpenAI和微軟的一系列組合拳,這一趨勢(shì)開(kāi)始逐漸被大家看到并相信。
ChatGPT引爆趨勢(shì)后,微軟率先將GPT-4整合到New bing,讓AI滲入到人們?nèi)粘J褂盟阉饕娴娜鞒讨小_@一波操作,直接讓New bing日活用戶破1億,數(shù)百萬(wàn)活躍用戶中,有三分之一都是新用戶。
緊接著,Office全家桶也宣布接入GPT-4,推出新功能Microsoft 365 Copilot。微軟CEO納德拉在發(fā)布會(huì)上直接放話:今天,進(jìn)入人機(jī)交互的新時(shí)代,重新發(fā)明生產(chǎn)力。
隨后國(guó)內(nèi)大廠也紛紛跟進(jìn),阿里放話要在所有產(chǎn)品中接入通義千問(wèn)。
但問(wèn)題是,有能力自己推出大模型、自己完成AI化升級(jí)的,畢竟還是極少數(shù)科技巨頭的“特權(quán)”。即便是直接接入API,也需要企業(yè)本身具備一定的開(kāi)發(fā)團(tuán)隊(duì)。因此在新的趨勢(shì)下,很多軟件和應(yīng)用服務(wù)方,都在急迫尋找一個(gè)效果好、門檻低的軟件應(yīng)用AI化方案。
而作為作為微軟和OpenAI的企業(yè)級(jí)合作伙伴,擁有領(lǐng)先商業(yè)化成果的心識(shí)宇宙,這幾個(gè)月自然要被人“踏破門檻”了。
據(jù)心識(shí)宇宙透露,從MindOS發(fā)布以來(lái),他們收到了數(shù)百家企業(yè)的試用申請(qǐng),尤其是今年1月趨勢(shì)引爆以后,申請(qǐng)量更是空前暴增。
目前,他們已經(jīng)和全球Top 3電商平臺(tái)之一、亞太地區(qū)頭部金融券商、全球頂尖跨境電商平臺(tái)、國(guó)內(nèi)頭部虛擬人公司和頭部元宇宙平臺(tái)達(dá)成合作。
人機(jī)交互變革的新起點(diǎn)
總之,心識(shí)宇宙的浮出水面,傳遞出了一個(gè)讓人頗為興奮的信號(hào):
更加自主的AI Copilot,正在大踏步走進(jìn)你我的生活。
加之最近AutoGPT、AgentGPT等自主人工智能工具爆火,再次驗(yàn)證了更加靈活、可靠、易用的AI是新趨勢(shì)的方向。
作為提前看到趨勢(shì),并率先開(kāi)啟技術(shù)研發(fā)、商業(yè)化落地的AGI領(lǐng)域創(chuàng)始人,陶芳波提出了自己的認(rèn)知和判斷,即未來(lái)世界的發(fā)展將會(huì)分為三個(gè)階段:
- 應(yīng)用和服務(wù)的AI化:任何需要用戶來(lái)做決策的過(guò)程,都應(yīng)該有AI Copilot的輔助,來(lái)更好提供深度需求理解和場(chǎng)景化推理。
- 個(gè)人為中心的AI出現(xiàn):每一個(gè)人,都可以在交互的過(guò)程中,逐漸培養(yǎng)一個(gè)和自己深度綁定、且可以幫助串聯(lián)任何事的AI Copilot。
- AI Copilot串聯(lián)成網(wǎng)絡(luò):應(yīng)用和服務(wù)的AI Copilot和每個(gè)個(gè)人AI Copilot,連接成一張全新的網(wǎng)絡(luò),服務(wù)的分發(fā)會(huì)在這個(gè)AI Network上發(fā)生。不是傳統(tǒng)的基于連接的分發(fā),而是基于理解和推理的分發(fā),這些AI Copilot會(huì)相互合作、協(xié)同,幫助人類完成復(fù)雜任務(wù)。
目前心識(shí)宇宙正在快速推進(jìn)的,就是第一階段。
第二階段也近在咫尺,在今年下半年,他們將會(huì)發(fā)布面向消費(fèi)者的MindOS,屆時(shí)所有人都有機(jī)會(huì)塑造一個(gè)專屬于自己的AI Copilot。
在這些趨勢(shì)下,一個(gè)更加震撼的變革也在悄然推進(jìn),即人機(jī)交互方式正在被改寫。
過(guò)去一百多年來(lái),人機(jī)交互的方式從最初的基于按鈕,發(fā)展到了通過(guò)命令行,再更進(jìn)一步飛躍到通過(guò)圖形界面完成交互。
當(dāng)下的計(jì)算機(jī)、智能手機(jī)等,人和軟件之間的信息交流,都是建立在GUI的基礎(chǔ)上,也讓人機(jī)交互從最初的僅限于專業(yè)人群,發(fā)展到了普通人范圍。
但對(duì)人機(jī)交互稍有了解的人都知道,人類最自然的交互方式,其實(shí)是語(yǔ)言。
比如想要查詢天氣,如果通過(guò)語(yǔ)言,只需要說(shuō)一句話“北京明天天氣怎么樣?”如果通過(guò)GUI,則需要用戶找到軟件、選擇城市、再查看具體的日期。
過(guò)去,由于AI的能力有限,這種基于語(yǔ)言的交互也只能做到淺嘗輒止。
AI語(yǔ)音助手往往是通過(guò)識(shí)別固定的句式、關(guān)鍵字,來(lái)做出機(jī)械式的回復(fù),給人帶來(lái)的體驗(yàn)升級(jí)比較有限。
如今,在大模型能力飛升的背景下,新的可能出現(xiàn)了。
當(dāng)AI可以充分理解人類語(yǔ)言、鏈接各方面能力,僅通過(guò)語(yǔ)言的人機(jī)交互就會(huì)成為最方便的交互方式。傳統(tǒng)由產(chǎn)品經(jīng)理定義UI界面的方式,都可能被改寫。
林宋琪表示:
未來(lái)用戶通過(guò)自然語(yǔ)言講解工作流程,AI就可以連通各個(gè)軟件的API,自主構(gòu)建工作流和專屬用戶的UI,這樣所有屏幕都可以變成AI的畫(huà)布,而每個(gè)AI助手都是用戶的“馬良神筆”。
也就是說(shuō),AGI之于軟件,正如Made to order之于制造,之前是供給到需求,之后是需求到供給,這是一種全新的生產(chǎn)方式。
由此產(chǎn)生的影響,或許都不局限于軟件領(lǐng)域,乃至硬件的生態(tài)都可能被改寫。
未來(lái),AI的載體可能是手機(jī)、電腦、頭顯,也可能像鋼鐵俠那樣——是機(jī)器人。

或許在以前,這種說(shuō)法會(huì)被定義為“美好的無(wú)限想象”,但是在ChatGPT趨勢(shì)下,創(chuàng)新正在“以小時(shí)為單位”發(fā)生。
兩個(gè)月前,學(xué)生們拿ChatGPT寫作業(yè)、考試,已經(jīng)讓人咋舌;而如今,人們開(kāi)始嘗試讓ChatGPT自己想辦法開(kāi)發(fā)網(wǎng)站、讓GPT-4控制實(shí)驗(yàn)室的機(jī)器人做化學(xué)實(shí)驗(yàn)……
似乎已經(jīng)沒(méi)什么不可能發(fā)生了。
而人們的無(wú)限憧憬與期待,或許也是AI創(chuàng)造無(wú)限可能的必要因素之一。
那么,你覺(jué)得人人一個(gè)AI Copilot會(huì)是人類的未來(lái)嗎?
P.S.本周心識(shí)宇宙將召開(kāi)MindOS內(nèi)測(cè)發(fā)布會(huì),感興趣的童鞋可戳下方鏈接報(bào)名:
Webinar 1: https://us02web.zoom.us/webinar/register/WN_mCV8jzA-S–4K5u9KssCug#/
Webinra 2: https://us02web.zoom.us/webinar/register/WN_Wpn01K2lTt2sbIw0M0e8IA#/registration
- DeepSeek-V3.2-Exp第一時(shí)間上線華為云2025-09-29
- 你的AI助手更萬(wàn)能了!天禧合作字節(jié)扣子,解鎖無(wú)限新功能2025-09-26
- 你的最快安卓芯片發(fā)布了!全面為Agent鋪路2025-09-26
- 任少卿在中科大招生了!碩博都可,推免學(xué)生下周一緊急面試2025-09-20




