阿里云進軍大模型一年，現(xiàn)在是開源第一名，CTO：閉源要超過所有開源模型才有機會參與討論

衡宇 2024-05-10 15:18:45 來源：量子位

趕超GPT-4

衡宇發(fā)自凹非寺

量子位 | 公眾號 QbitAI

阿里云正式發(fā)布通義千問2.5大模型，同時宣布性能全面趕超GPT-4 Turbo。

此時，距離阿里云通義大模型發(fā)布，恰好過去一周年；距離GPT-4發(fā)布，也已經(jīng)過去一年有余。

根據(jù)最新公布的數(shù)據(jù)，通義大模型通過阿里云服務(wù)企業(yè)超9萬，通義開源模型累計下載量突破700萬。

阿里云進軍大模型一年，現(xiàn)在是開源第一名，CTO：閉源要超過所有開源模型才有機會參與討論

同時，阿里云也正式宣布了“通義千問App”更名為“通義App”，為所有用戶提供免費服務(wù)。

通義意為“通情，達義”，該App以最新通義基礎(chǔ)大模型為底座，并把通義實驗室的文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等能力“All in one”。

阿里云CTO周靖人表示：

大模型這么多家，大家都說的是同樣的故事，但最后比拼的就是能力差異。包括最后比拼的是怎么融合生態(tài)，尤其是開發(fā)者的生態(tài)。
怎么把它落地運用起來，才是最大的差異。

通義千問2.5發(fā)布

先來看看最新發(fā)布的通義千問2.5版本。

周靖人介紹，相比通義千問2.1（去年12月1日發(fā)布），2.5版本的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%，中文能力尤其突出。

在權(quán)威基準OpenCompass（上海AI Lab出品）上，通義千問2.5得分追平GPT-4Turbo。這是該基準首次錄得國產(chǎn)大模型取得此等成績。

會上介紹，通義2.5加強了文檔處理能力。

可單次可處理多達1000萬字的長文檔，還能同時解析100份不同格式的文檔，支持多文件類型、多數(shù)據(jù)格式解析、多場景優(yōu)化，便于用戶使用和繼承。

同時，通義的音視頻理解能力也有迭代升級。

發(fā)布會上，周靖人著重介紹了專業(yè)提供智能編碼能力的通義靈碼，現(xiàn)在它不只支持個人程序員，也推出通義靈碼企業(yè)版本。

通義靈碼基于SOTA水準的通義千問代碼模型CodeQwen1.5研發(fā)，目前插件下載量超過350萬。剛剛過去的4月份，通義靈碼登頂了Big Code模型排行榜。

在技術(shù)能力迭代的基礎(chǔ)上，上述能力都集成在剛剛改名的通義App內(nèi)，用戶可以通過App和Web端進行使用。

百煉升級2.0版本

除了通義2.5模型以外，阿里云的百煉大模型平臺最新進展也進行了展示。

去年10月，阿里云發(fā)布了百煉大模型平臺，主要功能就是讓開發(fā)者通過簡單的拖拉拽，在5分鐘開發(fā)一款大模型應(yīng)用，幾小時煉出一個專屬模型。

現(xiàn)在升級后，百煉有了2.0版本，成為阿里云承載云+AI能力的重要平臺，提供一站式、全托管的大模型定制與應(yīng)用服務(wù)。

“當下企業(yè)應(yīng)用大模型存在三種范式：一是對大模型開箱即用，二是對大模型進行微調(diào)和持續(xù)訓練，三是基于模型開發(fā)應(yīng)用，其中最典型的需求是RAG，以企業(yè)數(shù)據(jù)對大模型進行知識增強。”周靖人展開介紹，“圍繞這些需求，百煉打造了模型中心和應(yīng)用中心，提供最豐富的模型和最易用的工具箱。”

目前，百煉聯(lián)動魔搭開源社區(qū)，集成了上百款大模型API，除了通義、Llama等系列，還有智譜ChatGLM、百川、月之暗面等系列模型。

對需進一步訓練模型的用戶，百煉提供從數(shù)據(jù)管理、模型調(diào)優(yōu)、評測到部署的模型服務(wù)，用戶可對算力按需調(diào)用，無需因底層架構(gòu)費腦筋。

此外，百煉還支持基于prompt定制和優(yōu)化、支持Assistant API開發(fā)模式，實現(xiàn)智能應(yīng)用的編排，結(jié)合自身需求做定制化開發(fā)。

持續(xù)開源

去年8月，通義宣布加入開源行列，隨之沿著“全模態(tài)、全尺寸”路線，陸續(xù)推出十多款模型。

其中較為矚目的是參數(shù)規(guī)模橫跨5億到1100億的八款大語言模型。

小尺寸開源模型：0.5B、1.8B、4B、7B、14B，可便捷地在手機、PC等端側(cè)設(shè)備部署；
中等尺寸開源模型：32B試圖在性能、效率和內(nèi)存占用之間找到最具性價比的平衡點。
大尺寸模型：如72B、110B能支持企業(yè)級和科研級的應(yīng)用。

此外，通義還開源了視覺理解模型Qwen-VL、音頻理解模型Qwen-Audio、代碼模型CodeQwen1.5-7B、混合專家模型Qwen1.5-MoE。

目前，通義開源模型系列下載量已經(jīng)超過700萬。

阿里云表示，自己是全球唯一持續(xù)開發(fā)模型、堅持開源的公司。

此次發(fā)布會上，通義也發(fā)布了最新款開源模型：1100億參數(shù)的Qwen1.5-110B。

該模型在MMLU、TheoremQA、GPQA等基準測評中，超越了Meta的Llama-3-70B模型；在HuggingFace推出的開源大模型排行榜OpenLLMLeaderboard上，Qwen1.5-110B沖上榜首。

最后，在談及開源技術(shù)時，周靖人表示，開源對全球技術(shù)的貢獻毋庸置疑，閉源模型至少要超過所有開源模型才有機會參與討論。

版權(quán)所有，未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用，違者必究。

大模型通義千問阿里云

衡宇

阿里云進軍大模型一年，現(xiàn)在是開源第一名，CTO：閉源要超過所有開源模型才有機會參與討論

通義千問2.5發(fā)布

百煉升級2.0版本

持續(xù)開源

相關(guān)閱讀

網(wǎng)盤用上大模型后「真香」！壓箱底黑照3秒找到，親朋好友都不淡定了

谷歌摸魚神器來了：推出AI會議替身，一鍵總結(jié)提問發(fā)言

大模型上崗三甲醫(yī)院，給每個醫(yī)生都配個“病歷質(zhì)控助手”

首個智慧城市大模型UrbanGPT，全面開源開放｜港大&百度

李開復麾下大模型公司零一萬物上線，數(shù)十位核心成員就位

愛分析AI與大模型高峰論壇成功舉辦，探討各場景新價值、新路徑

熱門文章

云計算一哥10分鐘發(fā)了25個新品！Kimi和MiniMax首次上桌

GPT5.5代號“蒜你狠”曝光！OpenAI拉響紅色警報加班趕制新模型，最快下周就發(fā)

英偉達巧用8B模型秒掉GPT-5，開源了

“豆包手機”在二手市場價格都翻倍了……

DeepSeekV3.2技術(shù)報告還是老外看得細