瀾舟堅(jiān)持四兩撥千斤:ToB場(chǎng)景落地,10B參數(shù)大模型足矣
“這個(gè)大小已經(jīng)可以解決80%的問(wèn)題’
衡宇 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
專(zhuān)注、極致、口碑、快、成本。
這是瀾舟科技創(chuàng)始人兼CEO周明給出的“大模型落地九字法則”,是他在雷軍互聯(lián)網(wǎng)“七字訣”的基礎(chǔ)上,加上了“成本”一詞而來(lái)。

他將2024年稱(chēng)為大模型落地元年,但同時(shí)堅(jiān)定地表示,這并不意味著遍地是黃金。
而大模型的具體落地姿態(tài),周明用自己帶領(lǐng)的大模型創(chuàng)業(yè)團(tuán)隊(duì)瀾舟科技身先士卒地做了個(gè)表率——利用瀾舟“一橫N縱”體系,以孟子大模型為基礎(chǔ),面向場(chǎng)景,發(fā)布產(chǎn)品。
簡(jiǎn)單來(lái)說(shuō),就是抓技術(shù)和應(yīng)用的雙輪驅(qū)動(dòng),在積極研究和掌握前沿技術(shù)的同時(shí),致力于確保這些技術(shù)的有效應(yīng)用。
3月18日的瀾舟大模型技術(shù)和產(chǎn)品發(fā)布會(huì)現(xiàn)場(chǎng),瀾舟科技還與零一萬(wàn)物進(jìn)行了戰(zhàn)略合作簽約。

現(xiàn)場(chǎng),創(chuàng)新工場(chǎng)董事長(zhǎng)、零一萬(wàn)物CEO李開(kāi)復(fù)分享,目前世界上最好的大模型智能已經(jīng)達(dá)到人類(lèi)平均智力水平的3倍,也就是說(shuō),100道題普通人只能答對(duì)33道,而最好的AI大模型可以答對(duì)99道以上。
他展望了AI 2.0時(shí)代未來(lái)的四大趨勢(shì):
- 最革命性的AI 2.0應(yīng)用應(yīng)該是AI-First / AI-Native:最終脫穎而出的應(yīng)用,屬于那些敢于全力投入新技術(shù)的先驅(qū)者。大語(yǔ)言模型的引入為 AI-First 應(yīng)用帶來(lái)了巨大的推動(dòng)力。
- 大模型始于文本,未來(lái)將拓展至“全模態(tài)”:跨模態(tài)生成技術(shù)是實(shí)現(xiàn)認(rèn)知和決策智能的轉(zhuǎn)折點(diǎn)。現(xiàn)實(shí)世界的信息是文本、音頻、視覺(jué)、傳感器以及人類(lèi)各種觸覺(jué)的綜合體系,要更為精準(zhǔn)地模擬現(xiàn)實(shí)世界,就需要將各種模態(tài)能力打通,例如文本-圖像、文本-視頻等跨模態(tài)甚至全模態(tài)的綜合能力。
- AI 2.0 將超越對(duì)話,從聊天工具到智能生產(chǎn)力工具:用戶體驗(yàn)以及未來(lái)交互界面和商業(yè)模式都會(huì)發(fā)生大的變革。
- AI 2.0 將走向?qū)嶓w,大幅提振社會(huì)生產(chǎn)力:具身智能可以讓機(jī)器人制造機(jī)器人,進(jìn)一步實(shí)現(xiàn)AI 2.0+生產(chǎn)線智能規(guī)劃。
專(zhuān)注研發(fā)10B-100B參數(shù)大模型
瀾舟科技成立于2021年6月,是國(guó)內(nèi)最早一批下場(chǎng),進(jìn)行大模型創(chuàng)業(yè)的團(tuán)隊(duì)。
去年3月,瀾舟發(fā)布了孟子GPT V1(MChat);今年1月,孟子大模型GPT V2(含孟子大模型-標(biāo)準(zhǔn)、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)對(duì)公眾開(kāi)放。
近期,瀾舟團(tuán)隊(duì)完成了Mengzi3-13B的大模型訓(xùn)練。

多說(shuō)一句,孟子大模型訓(xùn)練背后有個(gè)大功臣,即總規(guī)模3T tokens的Mengzi-3數(shù)據(jù)集,包含了網(wǎng)頁(yè)、代碼、書(shū)籍、論文等高質(zhì)量數(shù)據(jù)來(lái)源。
據(jù)介紹,本月底(3月30日),Mengzi3-13B的模型將在GitHub、HuggingFace、魔搭和始智AI社區(qū)開(kāi)源。
為什么開(kāi)源的孟子大模型,是13B版本的?周明正面回答了這個(gè)問(wèn)題。
首先,瀾舟明確以服務(wù)ToB場(chǎng)景為主,ToC為輔。
實(shí)踐發(fā)現(xiàn),ToB場(chǎng)景使用頻率最高的大模型參數(shù)量多為7B、13B、40B、100B,整體集中在10B-100B之間。
其次,在這個(gè)區(qū)間范圍內(nèi),從ROI角度來(lái)講,既滿足場(chǎng)景需求,又最具性?xún)r(jià)比。
所以很長(zhǎng)一段時(shí)間內(nèi),瀾舟的目標(biāo)都是做好10B-100B參數(shù)規(guī)模范圍內(nèi)的行業(yè)大模型。這就不能理解為什么開(kāi)源版本選擇13B。
周明解釋道,他自己本身其實(shí)也是Scaling law的信仰者,但創(chuàng)業(yè)不同于科研。
“第一,這個(gè)大小的大模型已經(jīng)可以解決80%的問(wèn)題;第二,對(duì)團(tuán)隊(duì)來(lái)說(shuō)也比較穩(wěn)定,不會(huì)因?yàn)椴粩鄶U(kuò)大的模型規(guī)模競(jìng)賽而感到焦躁不安。”周明補(bǔ)充說(shuō),這樣冷靜的思考,可以保證良好的成本控制,避免無(wú)謂的GPU算力、數(shù)據(jù)、人力投入競(jìng)賽。

“一橫N縱”體系
發(fā)布會(huì)上,瀾舟公布了自己的一橫N縱體系。
“一橫”是模型層,是孟子大模型技術(shù)基礎(chǔ)上研發(fā)的各個(gè)模型;
“N縱”則是基于孟子大模型的面向ToB應(yīng)用最重要的技術(shù)和產(chǎn)品。
據(jù)了解,瀾舟目前重點(diǎn)投入到了金融行業(yè),輔助編程等領(lǐng)域,旨在通過(guò)更加全面、專(zhuān)業(yè)、優(yōu)質(zhì)的領(lǐng)域數(shù)據(jù),打造更加貼近行業(yè)場(chǎng)景的垂直大模型。

以孟子GPT通用大模型的“一橫”為基礎(chǔ),瀾舟科技合伙人、首席產(chǎn)品官李京梅,介紹了瀾舟的應(yīng)用能力型產(chǎn)品,包括:
- AI文檔理解:涵蓋專(zhuān)業(yè)的PDF文檔解析能力和信息抽取能力,為RAG方案中的文檔理解提供了更優(yōu)的基礎(chǔ)能力;
- AI文檔問(wèn)答:根據(jù)企業(yè)需要,提供私有化企業(yè)智能知識(shí)庫(kù)構(gòu)建的解決方案能力;
- AI文檔輔助寫(xiě)作:支持用戶上傳多個(gè)文檔作為參考資料,支持自定義多級(jí)題目和寫(xiě)作提綱,由大模型賦能自動(dòng)化按要求生成完整的文章初稿;
- 機(jī)器翻譯平臺(tái):專(zhuān)注以中文為中心的世界主要語(yǔ)種之間互譯和20幾個(gè)領(lǐng)域的專(zhuān)業(yè)翻譯;
- 瀾舟智會(huì):專(zhuān)注會(huì)議內(nèi)容的智能分析和問(wèn)答的產(chǎn)品, 是基于大模型打造的大模型原生的智能會(huì)議助手;
- 瀾舟AI搜索:大語(yǔ)言模型時(shí)代的搜索引擎。

過(guò)去一年,大模型領(lǐng)域日新月異。
OpenAI在干什么我們就去干什么,短期可以,長(zhǎng)期不可取,一定要有自己的創(chuàng)新思路。
如何揚(yáng)長(zhǎng)避短,走出自己的獨(dú)特的創(chuàng)新之路,周明表達(dá)了自己的看法。
最關(guān)鍵的第一步,就是企業(yè)要有明確定位。瀾舟科技的定位就和國(guó)內(nèi)其它大模型創(chuàng)業(yè)公司有明顯差異。
他舉例,瀾舟的定位就是作“大模型技術(shù)+企業(yè)場(chǎng)景應(yīng)用”的綜合公司,“我們希望能做到站在技術(shù)角度最懂應(yīng)用,站在應(yīng)用角度最懂技術(shù),同時(shí)又希望把技術(shù)和應(yīng)用形成一種生態(tài)連接在一起,讓兩邊可以快速迭代。”

同時(shí),依然需要聚焦和抓緊落地——通過(guò)落地,創(chuàng)造價(jià)值,拉動(dòng)創(chuàng)新。
而且需要注意,創(chuàng)新和落地是相輔相成的。
不要一味的創(chuàng)新或者一味的落地,要把這兩者聯(lián)系在一起,讓它快速的迭代。
最后周明還語(yǔ)重心長(zhǎng)地提醒:
今年是大模型落地元年,就遍地是黃金是嗎?不是的,我可以負(fù)責(zé)任地說(shuō),很多地方我們都沒(méi)有開(kāi)拓出來(lái)。
比如大模型如何解決落地的最后一公里?大模型的商業(yè)模式是什么?如何加強(qiáng)交付能力?如何提高產(chǎn)品的商業(yè)化?
大模型落地的一切,其實(shí)才剛剛開(kāi)始。




