Transformer作者創(chuàng)業(yè)后首個(gè)成果亮相!用文本指揮AI做表格發(fā)郵件,這是先給自己造了個(gè)員工?
老羅的TNT被做出來(lái)了?
明敏 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
集結(jié)了Transformer作者、前OpenAI工程副總裁的創(chuàng)業(yè)團(tuán)隊(duì),不到半年就亮出首個(gè)大模型——
Action Transformer(ACT-1)。
簡(jiǎn)單來(lái)說(shuō),這是一個(gè)會(huì)使用瀏覽器、Excel等軟件工具的AI。
基于Transformer的自然語(yǔ)言處理能力,它能理解人類(lèi)給出的命令,并完成相應(yīng)操作。
比如,想要在Excel表格中加上利潤(rùn)、利潤(rùn)率,只需把這段話(huà)輸入給AI,它就能自己在對(duì)應(yīng)行列創(chuàng)建公式完成任務(wù)了。
想要在網(wǎng)上找房子,也不用自己搜索再設(shè)置各種篩選條件了。
只需要告訴AI:幫我在休斯頓找一套四口之家住的房子,預(yù)算在60萬(wàn)。
然后AI就能一氣呵成找到目標(biāo)范圍內(nèi)的房源了。
整個(gè)過(guò)程非常絲滑連貫,看上去比自己手動(dòng)操作要快上很多。
最大的好處就是不用自己來(lái)操作了,“吆喝”一聲即可,屬實(shí)是懶癌福音。
團(tuán)隊(duì)表示,他們認(rèn)為人類(lèi)在電腦上的各種操作,通用人工智能也能搞定,ACT-1正是他們朝這個(gè)方向邁出的第一步。
讓AI來(lái)幫助人機(jī)交互
從官方目前公布的功能來(lái)看,這個(gè)AI像是Siri、微軟小娜的究極加強(qiáng)版。
它的優(yōu)勢(shì)在于幫人們省去了很多繁雜的操作,比如在網(wǎng)頁(yè)上填信息表格,鼠標(biāo)不操作個(gè)十幾次很難搞定。
但是如果用AI,只需輸入一句話(huà)。
而且AI的操作并不局限在一個(gè)網(wǎng)頁(yè)。
讓它找個(gè)一千塊以下的冰箱并聯(lián)系賣(mài)家,AI先從購(gòu)物平臺(tái)上檢索,然后自己打開(kāi)郵箱寫(xiě)郵件。
遇到自己不懂的事情,還知道上維基百科搜索一番。
即便是操作失誤了,也能根據(jù)人類(lèi)給出的教程指導(dǎo)快速學(xué)習(xí)。
這不,一開(kāi)始弄成亂碼的Excel表格,在學(xué)習(xí)了正確的公式后,AI很快給出了正確的操作。
總之就是把日常我們用電腦時(shí)的一些繁瑣小事,交給AI來(lái)辦。
正如公司創(chuàng)始人兼CEO David Luan所說(shuō),他們希望由AI來(lái)完成一些瑣碎的基礎(chǔ)電腦操作,讓人類(lèi)更專(zhuān)注于自己的工作。
研發(fā)團(tuán)隊(duì)表示,他們是通過(guò)將ACT-1連接在一個(gè)Chrome擴(kuò)展程序上,讓它來(lái)觀察瀏覽器的一些操作,比如點(diǎn)擊、輸入、滾動(dòng)等。
目前來(lái)看ACT-1還有很多進(jìn)步空間。團(tuán)隊(duì)希望它最終的操作速度可以達(dá)到人類(lèi)察覺(jué)不到的水平。
值得一提的是,想讓AI來(lái)充當(dāng)人類(lèi)電腦操作助手的,并非Adept一家。
今年2月,DeepMind發(fā)表了一篇論文,表示他們利用數(shù)據(jù)驅(qū)動(dòng)的方法,讓AI學(xué)習(xí)到人類(lèi)操作電腦的方式,從而讓它們完成訂機(jī)票等任務(wù)。
DeepMind表示,他們訓(xùn)練的AI可以完成100多項(xiàng)任務(wù),并且都達(dá)到了人類(lèi)水平。
此外,由DeepMind聯(lián)合創(chuàng)始人穆斯塔法等人創(chuàng)立的Inflection AI,也是想以AI的方式,重新定義人機(jī)交互。
超豪華主創(chuàng)團(tuán)隊(duì)
ACT-1的打造者是Adept,今年4月官宣成立。
天使輪便拿下6500萬(wàn)美元融資,投資人包括Uber CEO、特斯拉自動(dòng)駕駛負(fù)責(zé)人、Airtable創(chuàng)始人等。
創(chuàng)始團(tuán)隊(duì)陣容非常豪華。
首席科學(xué)家是Ashish Vaswani。他是《Attention is all you need》的第一作者,平常看論文時(shí)經(jīng)常出現(xiàn)的“(Vaswani et al., 2017)”就是這位大佬。
他博士畢業(yè)于南加州大學(xué),在谷歌大腦工作已有5年。
Transformer的另一位作者Niki Parmar也加入了該團(tuán)隊(duì)。
她在印度上完大學(xué)后,同樣在南加州大學(xué)讀完碩士,在谷歌工作了近7年。
創(chuàng)始人兼CEO David Luan,是前OpenAI加州實(shí)驗(yàn)室工程副總裁,參與過(guò)GPT-2、GPT-3、CLIP、DALL-E等模型的開(kāi)發(fā),后來(lái)加入谷歌,曾任谷歌大腦大模型研究的Director。
除了以上幾位,團(tuán)隊(duì)人員還包括:
- Kelsey Schroeder,斯坦福大學(xué)計(jì)算數(shù)學(xué)(computational mathematics )專(zhuān)業(yè)碩士,前谷歌大模型生產(chǎn)infra的產(chǎn)品負(fù)責(zé)人;
- Anmol Gulati,在谷歌主要做語(yǔ)音識(shí)別模型;
- Augustus Odena,在谷歌領(lǐng)導(dǎo)大型語(yǔ)言模型相關(guān)的工作,也有不少圖像合成方面的研究;
- Erich Elsen,機(jī)器學(xué)習(xí)和高性能計(jì)算交叉領(lǐng)域的研究人員,前Deepmind員工,主要研究大模型,在更早之前,還分別在谷歌和百度(硅谷AI Lab)干了兩年;
- Fred Bertsch,谷歌數(shù)據(jù)和協(xié)作人工智能系統(tǒng)方面的專(zhuān)家。
最后一位,Maxwell Nye,是剛從MIT畢業(yè)的一位博士生,研究重點(diǎn)為自動(dòng)代碼生成。
總的來(lái)說(shuō),可謂大佬云集,且各有專(zhuān)攻。
目前,Adept的最新成果ACT-1還沒(méi)有對(duì)外開(kāi)放使用,但可以在官網(wǎng)排隊(duì)了~
以及團(tuán)隊(duì)正在招聘人才,感興趣的小伙伴可以關(guān)注一下子。
參考鏈接:
[1]https://twitter.com/AdeptAILabs/status/1570144499187453952
[2]https://techcrunch.com/2022/04/26/2304039/
- DeepSeek-V3.2-Exp第一時(shí)間上線華為云2025-09-29
- 你的AI助手更萬(wàn)能了!天禧合作字節(jié)扣子,解鎖無(wú)限新功能2025-09-26
- 你的最快安卓芯片發(fā)布了!全面為Agent鋪路2025-09-26
- 任少卿在中科大招生了!碩博都可,推免學(xué)生下周一緊急面試2025-09-20



