上海強(qiáng)攻算力高地,打響大模型商用基建第一槍
用“大算力+大模型”讓商業(yè)變革
金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
劍指大算力,上海有了新動(dòng)作——
正式成立臨港新片區(qū)智能算力產(chǎn)業(yè)聯(lián)盟(下文簡(jiǎn)稱聯(lián)盟)。

這就是在由上海臨港新片區(qū)管理委員會(huì)主辦的“臨港新片區(qū)智算大會(huì)”上所公布的最新消息。
整體來看,聯(lián)盟的構(gòu)成圍繞著一條“鏈”而展開:臨港新片區(qū)智算產(chǎn)業(yè)鏈。
顧名思義,這條“鏈”上的企業(yè)均是與智算產(chǎn)業(yè)息息相關(guān)的單位。
至于鏈主企業(yè),在本次大會(huì)中也已經(jīng)被上海臨港新片區(qū)管理委員確定——商湯科技。
△商湯科技董事長(zhǎng)兼CEO,徐立
而除了這條“鏈”上的企業(yè)之外,聯(lián)盟還涵蓋了智算產(chǎn)業(yè)上下游行業(yè)翹楚,以及知名高校及科研院所等。
那么這個(gè)聯(lián)盟的成立,到底要做什么?根據(jù)官方回答:
匯聚各方資源共建開放、完善的AI基礎(chǔ)設(shè)施服務(wù)體系,為加速應(yīng)用落地提供強(qiáng)大易用的智算底層支撐,助力構(gòu)筑上海人工智能發(fā)展新高地。
一言蔽之,就是落地,落地,落地;并以此來推動(dòng)商業(yè)的大變革。
變革之道:大算力+大模型
自從去年11月ChatGPT爆火以來,生成式AI在全球范圍內(nèi)受到了高度的關(guān)注。
與此同時(shí),同樣熱度不減的一個(gè)概念,便是“大模型”。
從整個(gè)業(yè)界目前的趨勢(shì)來看,各家科技巨頭乃至中小企業(yè),都是在大模型身上發(fā)力,不斷突破參數(shù)量的極限。
例如OpenAI的GPT-3參數(shù)量是1750億,而據(jù)傳言,GPT-4的參數(shù)量已經(jīng)突破了驚人的萬億。
之所以如此,正是應(yīng)了那句“大力出奇跡”——參數(shù)量越大,訓(xùn)練出來的模型效果一般都會(huì)更好。
而如此量變引發(fā)質(zhì)變的背后,還有一大關(guān)鍵因素,那便是大算力。
畢竟單是訓(xùn)練一個(gè)GPT-3,便是要用10000張V100卡,訓(xùn)練個(gè)整整近15天,消耗了大約600PFLOPS的算力。
因此,在這種大背景之下,商湯針對(duì)臨港新片區(qū)智算產(chǎn)業(yè)鏈所要實(shí)現(xiàn)的變革,提出了一條道路——
大模型+大算力。

在商湯看來,AGI時(shí)代之下,數(shù)據(jù)、算法和算力三要素有了新的需求:
計(jì)算量(GPU數(shù)量 x 運(yùn)行時(shí)間 x 并行效率 )=?模型參數(shù)量?x?處理數(shù)據(jù)量。
怎么理解?
模型參數(shù)量要足夠多,才能實(shí)現(xiàn)AI智慧的涌現(xiàn),而這也帶來了對(duì)算力的劇增,需要更高的并行效率,才能有效支持大參數(shù)模型訓(xùn)練。
數(shù)據(jù)方面,高質(zhì)量自然語言數(shù)據(jù)逐漸稀缺,而視覺數(shù)據(jù)相較自然語言在數(shù)量、質(zhì)量、容納信息等方面有多種優(yōu)勢(shì),能夠使得AI更好地理解世界。
變革之道是提出來了,那又取得了怎樣的效果?
在現(xiàn)場(chǎng),商湯聯(lián)合創(chuàng)始人楊帆便介紹道:
對(duì)臨港實(shí)景進(jìn)行大規(guī)模三維場(chǎng)景重建這種任務(wù),在“大模型+大算力”的加持之下,數(shù)小時(shí)就可以完成以往人工數(shù)周乃至數(shù)月才能完成的高精渲染工作。

再如在氣象氣候預(yù)報(bào)任務(wù)中,全球中期天氣預(yù)報(bào)是最重要的預(yù)測(cè)任務(wù)之一。
而現(xiàn)如今,隨著商湯全球中期氣象預(yù)報(bào)AI大模型“風(fēng)烏”的問世,首次實(shí)現(xiàn)在高分辨率上對(duì)核心大氣變量進(jìn)行超過10天的有效預(yù)報(bào),且在80%的評(píng)估指標(biāo)上超越GraphCast模型。
不僅如此,“風(fēng)烏”還可以模擬臺(tái)風(fēng)等極端氣象,準(zhǔn)確預(yù)測(cè)臺(tái)風(fēng)軌跡。
遙感AI大模型方面,商湯以通用視覺大模型為基礎(chǔ),具有不同地物種類、影像類型、影像時(shí)間和譜段的高泛化能力,擁有先進(jìn)的地物解譯能力和媲美人工標(biāo)注的生成式圖斑效果。
再如自動(dòng)駕駛方面,商湯提出的UniAD是業(yè)內(nèi)首個(gè)感知決策一體化的端到端自動(dòng)駕駛解決方案,將環(huán)視的圖片通過Transformer映射得到BEV的特征,同時(shí)進(jìn)行目標(biāo)跟蹤,在線建圖,目標(biāo)軌跡預(yù)測(cè),以及障礙物預(yù)測(cè)。
甚至在游戲領(lǐng)域,商湯在近日還聯(lián)合清華提出通才AI智能體GITM,能夠在緊密模擬真實(shí)世界的暢銷游戲《我的世界》中做到像人類一樣生存、探索和創(chuàng)造。
并在主世界所有技術(shù)挑戰(zhàn)上實(shí)現(xiàn)了100%的任務(wù)覆蓋率。
不僅是在各種領(lǐng)域量的積累,商湯自身在大模型的發(fā)展也是堪稱飛速。
例如今年3月開源的“書生2.5”多模態(tài)大模型在檢測(cè)、分割、分類三大主流視覺任務(wù)下二十多個(gè)權(quán)威數(shù)據(jù)集上全面領(lǐng)先。
這也為上述自動(dòng)駕駛、機(jī)器人等通用場(chǎng)景任務(wù)提供高效精準(zhǔn)的感知和理解能力支持。
而在最新的發(fā)布中,商湯憑借“日日新”大模型體系,一口氣涵蓋AI內(nèi)容創(chuàng)作、AI數(shù)字人視頻生成和3D內(nèi)容生成等。

而這些大模型所要發(fā)力之處,正是諸如醫(yī)療、短視頻、教育、營(yíng)銷以及開發(fā)等產(chǎn)業(yè)領(lǐng)域。
……
不難看出,商湯的大模型已然是覆蓋了產(chǎn)業(yè)中方方面面。
據(jù)楊帆介紹,截至今年5月,商湯“大模型+大算力”的方式,已經(jīng)涵蓋智能駕駛、生物制藥、芯片設(shè)計(jì)、智慧商業(yè)、高校科研等前沿領(lǐng)域,并已在超過20個(gè)落地場(chǎng)景中實(shí)現(xiàn)大模型交付。
不僅如此,本次大會(huì)上,商湯還與中國(guó)信息通信研究院聯(lián)合預(yù)發(fā)布《新型AI智算基礎(chǔ)設(shè)施白皮書》,將從多個(gè)層面解析新型AI基礎(chǔ)設(shè)施的發(fā)展特征和建設(shè)需求,以適應(yīng)生產(chǎn)范式的重大轉(zhuǎn)變,支撐AI發(fā)展進(jìn)入2.0階段。
為什么要采取這種模式?
若是將人工智能的發(fā)展歷史鋪開來看,就不難理解商湯如此之舉的原因了。
因?yàn)檎麄€(gè)人工智能的技術(shù)迭代進(jìn)步的歷史,其實(shí)就是對(duì)暴力美學(xué)的追求,以及算法、算力、數(shù)據(jù)三要素由量變產(chǎn)生質(zhì)變的技術(shù)迭代過程。

但這種暴力美學(xué)并不意味著擁有更多的資源、算力、數(shù)據(jù),就一定能讓智能得到飛躍;更準(zhǔn)確的來講,它只是一個(gè)必要而非充分的條件。
對(duì)此,楊帆認(rèn)為:
真正支撐暴力美學(xué)背后產(chǎn)生重大的技術(shù)創(chuàng)新和成果的,恰恰是在每一個(gè)環(huán)節(jié)的一些持續(xù)性的優(yōu)化和改進(jìn)。
一言蔽之,大力出奇跡的背后,是通過人工智能三要素的持續(xù)規(guī)模上升帶來的技術(shù)價(jià)值的提升。
而且這三要素很多時(shí)候是聯(lián)合調(diào)優(yōu)的,算法的優(yōu)化、數(shù)據(jù)的整理和選取,以及算力的平臺(tái)性,這三者間往往是互相連通的,很難把它變成割裂的環(huán)節(jié)獨(dú)自去做。
這也同樣解釋了為什么要成立智能算力產(chǎn)業(yè)鏈的原因:
只有鏈上的更多企業(yè),通過促進(jìn)彼此的交流合作思考,更深度的進(jìn)行合作,我們才能夠在新的關(guān)鍵性的重大技術(shù)浪潮中,做到更好的技術(shù)進(jìn)步和支持。
而在如此新一輪技術(shù)的大浪潮之中,我們還需要有一個(gè)認(rèn)知上的變化,那便是“新二八定律”。

在舊二八定律中,對(duì)于業(yè)務(wù)的開發(fā)邏輯,是20%由AI模型處理,80%的壓力給到了人類開發(fā)者這邊。
而在未來的大模型時(shí)代,80%的任務(wù)應(yīng)當(dāng)由AI大模型來完成,人類只需要負(fù)責(zé)20%的提示工程等。
所有行業(yè)從業(yè)者,不管是應(yīng)用的開發(fā)者,還是技術(shù)的工程師,未來可能更大的精力是需要跟大模型對(duì)話。
最后,說到關(guān)鍵的持續(xù)發(fā)力,商湯多年來亦是如此。
無論是新出的日日新大模型,還是商湯AI大裝置SenseCore,都不是一蹴而就的事情。
例如早在五年前,商湯便已經(jīng)在大模型領(lǐng)域著手研發(fā)。
并且在2019年,商湯便使用上千張GPU進(jìn)行單任務(wù)訓(xùn)練,推出了10億參數(shù)規(guī)模的視覺模型,并實(shí)現(xiàn)了當(dāng)時(shí)業(yè)界最好的算法效果。
后來在2021年到2022年期間,商湯訓(xùn)練并開源了30億參數(shù)的多模態(tài)大模型——書生。
就目前來看,商湯已經(jīng)成功研發(fā)了320億參數(shù)量的全球最大的通用視覺模型;并且已經(jīng)打造了CV、NLP和AIGC相關(guān)大模型。
所以,它是通過一步一步的“小作業(yè)”,才有了如今的這份“大作業(yè)”。
再如算力方面,商湯在2022年1月便首付56億元,啟動(dòng)運(yùn)營(yíng)亞洲最大的AI超算中心之一的人工智能計(jì)算中心(AIDC)。

時(shí)隔一年,現(xiàn)如今,這個(gè)算力數(shù)字已然是翻了個(gè)小翻,達(dá)到了5000PFLOPS!
它可以以最大3200卡規(guī)模集群進(jìn)行單任務(wù)訓(xùn)練,并可做到七天以上不間斷的穩(wěn)定訓(xùn)練。
總而言之,商湯可以說是用“大模型+大算力”的方式,在自身做了多年的試驗(yàn),也取得了一定的成績(jī)。
因此,面對(duì)加速智能產(chǎn)業(yè)落地這樣的任務(wù),這種模式可以說是正解之一。
至于未來會(huì)取得怎樣的效果,是值得期待了。




