瀾舟堅(jiān)持四兩撥千斤：ToB場(chǎng)景落地，10B參數(shù)大模型足矣

衡宇 2024-03-19 16:29:20 來(lái)源：量子位

“這個(gè)大小已經(jīng)可以解決80%的問(wèn)題’

衡宇發(fā)自凹非寺

量子位 | 公眾號(hào) QbitAI

專(zhuān)注、極致、口碑、快、成本。

這是瀾舟科技創(chuàng)始人兼CEO周明給出的“大模型落地九字法則”，是他在雷軍互聯(lián)網(wǎng)“七字訣”的基礎(chǔ)上，加上了“成本”一詞而來(lái)。

瀾舟堅(jiān)持四兩撥千斤：ToB場(chǎng)景落地，10B參數(shù)大模型足矣

他將2024年稱(chēng)為大模型落地元年，但同時(shí)堅(jiān)定地表示，這并不意味著遍地是黃金。

而大模型的具體落地姿態(tài)，周明用自己帶領(lǐng)的大模型創(chuàng)業(yè)團(tuán)隊(duì)瀾舟科技身先士卒地做了個(gè)表率——利用瀾舟“一橫N縱”體系，以孟子大模型為基礎(chǔ)，面向場(chǎng)景，發(fā)布產(chǎn)品。

簡(jiǎn)單來(lái)說(shuō)，就是抓技術(shù)和應(yīng)用的雙輪驅(qū)動(dòng)，在積極研究和掌握前沿技術(shù)的同時(shí)，致力于確保這些技術(shù)的有效應(yīng)用。

3月18日的瀾舟大模型技術(shù)和產(chǎn)品發(fā)布會(huì)現(xiàn)場(chǎng)，瀾舟科技還與零一萬(wàn)物進(jìn)行了戰(zhàn)略合作簽約。

現(xiàn)場(chǎng)，創(chuàng)新工場(chǎng)董事長(zhǎng)、零一萬(wàn)物CEO李開(kāi)復(fù)分享，目前世界上最好的大模型智能已經(jīng)達(dá)到人類(lèi)平均智力水平的3倍，也就是說(shuō)，100道題普通人只能答對(duì)33道，而最好的AI大模型可以答對(duì)99道以上。

他展望了AI 2.0時(shí)代未來(lái)的四大趨勢(shì)：

最革命性的AI 2.0應(yīng)用應(yīng)該是AI-First / AI-Native：最終脫穎而出的應(yīng)用，屬于那些敢于全力投入新技術(shù)的先驅(qū)者。大語(yǔ)言模型的引入為 AI-First 應(yīng)用帶來(lái)了巨大的推動(dòng)力。
大模型始于文本，未來(lái)將拓展至“全模態(tài)”：跨模態(tài)生成技術(shù)是實(shí)現(xiàn)認(rèn)知和決策智能的轉(zhuǎn)折點(diǎn)。現(xiàn)實(shí)世界的信息是文本、音頻、視覺(jué)、傳感器以及人類(lèi)各種觸覺(jué)的綜合體系，要更為精準(zhǔn)地模擬現(xiàn)實(shí)世界，就需要將各種模態(tài)能力打通，例如文本-圖像、文本-視頻等跨模態(tài)甚至全模態(tài)的綜合能力。
AI 2.0 將超越對(duì)話，從聊天工具到智能生產(chǎn)力工具：用戶體驗(yàn)以及未來(lái)交互界面和商業(yè)模式都會(huì)發(fā)生大的變革。
AI 2.0 將走向?qū)嶓w，大幅提振社會(huì)生產(chǎn)力：具身智能可以讓機(jī)器人制造機(jī)器人，進(jìn)一步實(shí)現(xiàn)AI 2.0+生產(chǎn)線智能規(guī)劃。

專(zhuān)注研發(fā)10B-100B參數(shù)大模型

瀾舟科技成立于2021年6月，是國(guó)內(nèi)最早一批下場(chǎng)，進(jìn)行大模型創(chuàng)業(yè)的團(tuán)隊(duì)。

去年3月，瀾舟發(fā)布了孟子GPT V1（MChat）；今年1月，孟子大模型GPT V2（含孟子大模型-標(biāo)準(zhǔn)、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼）對(duì)公眾開(kāi)放。

近期，瀾舟團(tuán)隊(duì)完成了Mengzi3-13B的大模型訓(xùn)練。

多說(shuō)一句，孟子大模型訓(xùn)練背后有個(gè)大功臣，即總規(guī)模3T tokens的Mengzi-3數(shù)據(jù)集，包含了網(wǎng)頁(yè)、代碼、書(shū)籍、論文等高質(zhì)量數(shù)據(jù)來(lái)源。

據(jù)介紹，本月底（3月30日），Mengzi3-13B的模型將在GitHub、HuggingFace、魔搭和始智AI社區(qū)開(kāi)源。

為什么開(kāi)源的孟子大模型，是13B版本的？周明正面回答了這個(gè)問(wèn)題。

首先，瀾舟明確以服務(wù)ToB場(chǎng)景為主，ToC為輔。

實(shí)踐發(fā)現(xiàn)，ToB場(chǎng)景使用頻率最高的大模型參數(shù)量多為7B、13B、40B、100B，整體集中在10B-100B之間。

其次，在這個(gè)區(qū)間范圍內(nèi)，從ROI角度來(lái)講，既滿足場(chǎng)景需求，又最具性?xún)r(jià)比。

所以很長(zhǎng)一段時(shí)間內(nèi)，瀾舟的目標(biāo)都是做好10B-100B參數(shù)規(guī)模范圍內(nèi)的行業(yè)大模型。這就不能理解為什么開(kāi)源版本選擇13B。

周明解釋道，他自己本身其實(shí)也是Scaling law的信仰者，但創(chuàng)業(yè)不同于科研。

“第一，這個(gè)大小的大模型已經(jīng)可以解決80%的問(wèn)題；第二，對(duì)團(tuán)隊(duì)來(lái)說(shuō)也比較穩(wěn)定，不會(huì)因?yàn)椴粩鄶U(kuò)大的模型規(guī)模競(jìng)賽而感到焦躁不安。”周明補(bǔ)充說(shuō)，這樣冷靜的思考，可以保證良好的成本控制，避免無(wú)謂的GPU算力、數(shù)據(jù)、人力投入競(jìng)賽。

“一橫N縱”體系

發(fā)布會(huì)上，瀾舟公布了自己的一橫N縱體系。

“一橫”是模型層，是孟子大模型技術(shù)基礎(chǔ)上研發(fā)的各個(gè)模型；

“N縱”則是基于孟子大模型的面向ToB應(yīng)用最重要的技術(shù)和產(chǎn)品。

據(jù)了解，瀾舟目前重點(diǎn)投入到了金融行業(yè)，輔助編程等領(lǐng)域，旨在通過(guò)更加全面、專(zhuān)業(yè)、優(yōu)質(zhì)的領(lǐng)域數(shù)據(jù)，打造更加貼近行業(yè)場(chǎng)景的垂直大模型。

以孟子GPT通用大模型的“一橫”為基礎(chǔ)，瀾舟科技合伙人、首席產(chǎn)品官李京梅，介紹了瀾舟的應(yīng)用能力型產(chǎn)品，包括：

AI文檔理解：涵蓋專(zhuān)業(yè)的PDF文檔解析能力和信息抽取能力，為RAG方案中的文檔理解提供了更優(yōu)的基礎(chǔ)能力；
AI文檔問(wèn)答：根據(jù)企業(yè)需要，提供私有化企業(yè)智能知識(shí)庫(kù)構(gòu)建的解決方案能力；
AI文檔輔助寫(xiě)作：支持用戶上傳多個(gè)文檔作為參考資料，支持自定義多級(jí)題目和寫(xiě)作提綱，由大模型賦能自動(dòng)化按要求生成完整的文章初稿；
機(jī)器翻譯平臺(tái)：專(zhuān)注以中文為中心的世界主要語(yǔ)種之間互譯和20幾個(gè)領(lǐng)域的專(zhuān)業(yè)翻譯；
瀾舟智會(huì)：專(zhuān)注會(huì)議內(nèi)容的智能分析和問(wèn)答的產(chǎn)品，是基于大模型打造的大模型原生的智能會(huì)議助手；
瀾舟AI搜索：大語(yǔ)言模型時(shí)代的搜索引擎。

過(guò)去一年，大模型領(lǐng)域日新月異。

OpenAI在干什么我們就去干什么，短期可以，長(zhǎng)期不可取，一定要有自己的創(chuàng)新思路。

如何揚(yáng)長(zhǎng)避短，走出自己的獨(dú)特的創(chuàng)新之路，周明表達(dá)了自己的看法。

最關(guān)鍵的第一步，就是企業(yè)要有明確定位。瀾舟科技的定位就和國(guó)內(nèi)其它大模型創(chuàng)業(yè)公司有明顯差異。

他舉例，瀾舟的定位就是作“大模型技術(shù)+企業(yè)場(chǎng)景應(yīng)用”的綜合公司，“我們希望能做到站在技術(shù)角度最懂應(yīng)用，站在應(yīng)用角度最懂技術(shù)，同時(shí)又希望把技術(shù)和應(yīng)用形成一種生態(tài)連接在一起，讓兩邊可以快速迭代。”

同時(shí)，依然需要聚焦和抓緊落地——通過(guò)落地，創(chuàng)造價(jià)值，拉動(dòng)創(chuàng)新。

而且需要注意，創(chuàng)新和落地是相輔相成的。

不要一味的創(chuàng)新或者一味的落地，要把這兩者聯(lián)系在一起，讓它快速的迭代。

最后周明還語(yǔ)重心長(zhǎng)地提醒：

今年是大模型落地元年，就遍地是黃金是嗎？不是的，我可以負(fù)責(zé)任地說(shuō)，很多地方我們都沒(méi)有開(kāi)拓出來(lái)。

比如大模型如何解決落地的最后一公里？大模型的商業(yè)模式是什么？如何加強(qiáng)交付能力？如何提高產(chǎn)品的商業(yè)化？

大模型落地的一切，其實(shí)才剛剛開(kāi)始。

版權(quán)所有，未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用，違者必究。

周明瀾舟科技行業(yè)大模型

衡宇

瀾舟堅(jiān)持四兩撥千斤：ToB場(chǎng)景落地，10B參數(shù)大模型足矣

專(zhuān)注研發(fā)10B-100B參數(shù)大模型

“一橫N縱”體系

相關(guān)閱讀

谷歌醫(yī)療版ChatGPT已在診所實(shí)測(cè)！可生成診斷做總結(jié)，多個(gè)指標(biāo)和真人醫(yī)生相當(dāng)

瀾舟科技周明：大模型正在催生新AI中臺(tái) | 中國(guó)AIGC產(chǎn)業(yè)峰會(huì)

AI大牛周明發(fā)布MChat：生成可控，參數(shù)規(guī)模可負(fù)擔(dān)，順便官宣了新融資

AI大牛周明打造輕量“孟子模型”開(kāi)源！靠10億參數(shù)沖上CLUE榜第三

大模型產(chǎn)業(yè)落地關(guān)鍵戰(zhàn)打響！百度首發(fā)行業(yè)大模型，外加一口氣十連發(fā)

曠視實(shí)戰(zhàn)大模型：把多模態(tài)扎進(jìn)行業(yè)

熱門(mén)文章

英偉達(dá)巧用8B模型秒掉GPT-5，開(kāi)源了

SpaceX估值8000億美元超OpenAI，IPO就在明年

Ilya剛預(yù)言完，世界首個(gè)原生多模態(tài)架構(gòu)NEO就來(lái)了：視覺(jué)和語(yǔ)言徹底被焊死

跨境電商的疑難雜癥，被1688這個(gè)AI全包了…

14歲華人小孩，折個(gè)紙成美國(guó)天才少年