阿里云進軍大模型一年,現(xiàn)在是開源第一名,CTO:閉源要超過所有開源模型才有機會參與討論
趕超GPT-4
衡宇 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
阿里云正式發(fā)布通義千問2.5大模型,同時宣布性能全面趕超GPT-4 Turbo。
此時,距離阿里云通義大模型發(fā)布,恰好過去一周年;距離GPT-4發(fā)布,也已經(jīng)過去一年有余。
根據(jù)最新公布的數(shù)據(jù),通義大模型通過阿里云服務(wù)企業(yè)超9萬,通義開源模型累計下載量突破700萬。

同時,阿里云也正式宣布了“通義千問App”更名為“通義App”,為所有用戶提供免費服務(wù)。
通義意為“通情,達義”,該App以最新通義基礎(chǔ)大模型為底座,并把通義實驗室的文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等能力“All in one”。
阿里云CTO周靖人表示:
大模型這么多家,大家都說的是同樣的故事,但最后比拼的就是能力差異。包括最后比拼的是怎么融合生態(tài),尤其是開發(fā)者的生態(tài)。
怎么把它落地運用起來,才是最大的差異。

通義千問2.5發(fā)布
先來看看最新發(fā)布的通義千問2.5版本。
周靖人介紹,相比通義千問2.1(去年12月1日發(fā)布),2.5版本的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%,中文能力尤其突出。
在權(quán)威基準OpenCompass(上海AI Lab出品)上,通義千問2.5得分追平GPT-4Turbo。這是該基準首次錄得國產(chǎn)大模型取得此等成績。

會上介紹,通義2.5加強了文檔處理能力。
可單次可處理多達1000萬字的長文檔,還能同時解析100份不同格式的文檔,支持多文件類型、多數(shù)據(jù)格式解析、多場景優(yōu)化,便于用戶使用和繼承。

同時,通義的音視頻理解能力也有迭代升級。
發(fā)布會上,周靖人著重介紹了專業(yè)提供智能編碼能力的通義靈碼,現(xiàn)在它不只支持個人程序員,也推出通義靈碼企業(yè)版本。
通義靈碼基于SOTA水準的通義千問代碼模型CodeQwen1.5研發(fā),目前插件下載量超過350萬。剛剛過去的4月份,通義靈碼登頂了Big Code模型排行榜。

在技術(shù)能力迭代的基礎(chǔ)上,上述能力都集成在剛剛改名的通義App內(nèi),用戶可以通過App和Web端進行使用。

百煉升級2.0版本
除了通義2.5模型以外,阿里云的百煉大模型平臺最新進展也進行了展示。
去年10月,阿里云發(fā)布了百煉大模型平臺,主要功能就是讓開發(fā)者通過簡單的拖拉拽,在5分鐘開發(fā)一款大模型應(yīng)用,幾小時煉出一個專屬模型。
現(xiàn)在升級后,百煉有了2.0版本,成為阿里云承載云+AI能力的重要平臺,提供一站式、全托管的大模型定制與應(yīng)用服務(wù)。

“當下企業(yè)應(yīng)用大模型存在三種范式:一是對大模型開箱即用,二是對大模型進行微調(diào)和持續(xù)訓練,三是基于模型開發(fā)應(yīng)用,其中最典型的需求是RAG,以企業(yè)數(shù)據(jù)對大模型進行知識增強。”周靖人展開介紹,“圍繞這些需求,百煉打造了模型中心和應(yīng)用中心,提供最豐富的模型和最易用的工具箱。”
目前,百煉聯(lián)動魔搭開源社區(qū),集成了上百款大模型API,除了通義、Llama等系列,還有智譜ChatGLM、百川、月之暗面等系列模型。

對需進一步訓練模型的用戶,百煉提供從數(shù)據(jù)管理、模型調(diào)優(yōu)、評測到部署的模型服務(wù),用戶可對算力按需調(diào)用,無需因底層架構(gòu)費腦筋。
此外,百煉還支持基于prompt定制和優(yōu)化、支持Assistant API開發(fā)模式,實現(xiàn)智能應(yīng)用的編排,結(jié)合自身需求做定制化開發(fā)。
持續(xù)開源
去年8月,通義宣布加入開源行列,隨之沿著“全模態(tài)、全尺寸”路線,陸續(xù)推出十多款模型。
其中較為矚目的是參數(shù)規(guī)模橫跨5億到1100億的八款大語言模型。
- 小尺寸開源模型:0.5B、1.8B、4B、7B、14B,可便捷地在手機、PC等端側(cè)設(shè)備部署;
- 中等尺寸開源模型:32B試圖在性能、效率和內(nèi)存占用之間找到最具性價比的平衡點。
- 大尺寸模型:如72B、110B能支持企業(yè)級和科研級的應(yīng)用。
此外,通義還開源了視覺理解模型Qwen-VL、音頻理解模型Qwen-Audio、代碼模型CodeQwen1.5-7B、混合專家模型Qwen1.5-MoE。
目前,通義開源模型系列下載量已經(jīng)超過700萬。
阿里云表示,自己是全球唯一持續(xù)開發(fā)模型、堅持開源的公司。

此次發(fā)布會上,通義也發(fā)布了最新款開源模型:1100億參數(shù)的Qwen1.5-110B。
該模型在MMLU、TheoremQA、GPQA等基準測評中,超越了Meta的Llama-3-70B模型;在HuggingFace推出的開源大模型排行榜OpenLLMLeaderboard上,Qwen1.5-110B沖上榜首。

最后,在談及開源技術(shù)時,周靖人表示,開源對全球技術(shù)的貢獻毋庸置疑,閉源模型至少要超過所有開源模型才有機會參與討論。




