阿里通義上新PPT創(chuàng)作!PC端“效率”功能三合一,聽(tīng)讀寫(xiě)一站搞定
PPTSD?達(dá)咩!
魚(yú)羊 衡宇 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
這年頭,哪有人上班不發(fā)瘋的(doge)。
就拿PPT來(lái)說(shuō),趙曉卉“PPTSD”這詞兒一出,那真是戳到了打工人心坎上。

對(duì)啊,PPT是什么高貴的東西啊!都大模型時(shí)代了,就沒(méi)有哪個(gè)AI能又好又快地幫我搞定這事兒?jiǎn)幔?/p>

還真別說(shuō),打工人是會(huì)心疼打工人的。就在俺們量子位編輯們孜孜不倦尋找解放雙手的大模型工具的日常中,誒嘿,最近還真又挖到了新神器——
通義直接在網(wǎng)頁(yè)版里上新了“效率”版塊,功能很直給:實(shí)時(shí)記錄、閱讀助手,還有PPT創(chuàng)作。
其中,PPT創(chuàng)作屬于是新鮮出爐。

簡(jiǎn)單來(lái)說(shuō),主打一個(gè)功能是大模型給的,但并沒(méi)多大“AI味”。
最關(guān)鍵的是,免費(fèi)。
這咱不得抓緊測(cè)試一波——
拒絕PPTSD

具體來(lái)說(shuō),通義PPT創(chuàng)作主要提供了兩種PPT制作方式。
- 一句話主題生成PPT:如果你啥思路沒(méi)有,只有一句話主題,那么可以把主題當(dāng)成Prompt直接扔給大模型。當(dāng)然,如果你已經(jīng)有完整的思路大綱,它也支持最多10萬(wàn)字的超長(zhǎng)文本輸入。
- 上傳文件生成PPT:文檔、音視頻文件都支持。

一句話生成PPT
那么就,先給又菜又愛(ài)玩的手殘黨同事們,搞一份《黑神話:悟空》攻略(PPT版)吧。
提示詞很簡(jiǎn)短,就是:《黑神話:悟空》游戲攻略。
一份像模像樣的PPT大綱秒速生成:

哪里看不順眼可以上手修改,懶人黨也可以直接下一步——選模板。

在不提供任何背景資料的情況下,通義生成的PPT能達(dá)到什么樣的效果?
點(diǎn)擊“生成PPT”,等待不到1分鐘,答案即刻揭曉。

應(yīng)該是基于通義大模型的聯(lián)網(wǎng)搜索能力,生成的游戲介紹里,《黑神話》的制作方、游戲引擎等重點(diǎn)信息都沒(méi)出錯(cuò)。

不過(guò)大模型本身看上去并沒(méi)有被“劇透”,在具體游戲內(nèi)容上,有點(diǎn)腦洞大開(kāi)。但話術(shù)組織,設(shè)計(jì)排版,還真可圈可點(diǎn)。
單看這文案,確實(shí)沒(méi)什么AI味兒,說(shuō)得上是言之有物。

人機(jī)協(xié)作修改起來(lái)也很方便:
點(diǎn)擊文本框既能直接修改文字,也可以一鍵召喚大模型幫忙一起優(yōu)化文案。

配圖同樣可以交給AI生成。
不會(huì)寫(xiě)提示詞也沒(méi)關(guān)系,通義PPT內(nèi)置“咒語(yǔ)書(shū)”,點(diǎn)擊即用,也可以作為參考。

看樣子,日常用來(lái)糊弄老板妥妥夠用了(不是)。
上傳文件生成PPT
咳咳,還是回到正經(jīng)用途上,如果喂給通義PPT更詳細(xì)的文檔資料,它又會(huì)表現(xiàn)如何?
比如,投喂一份量子位的內(nèi)部培訓(xùn)資料,讓通義PPT來(lái)幫忙搞定培訓(xùn)PPT。

效果上be like:媽媽再也不用擔(dān)心我開(kāi)會(huì)前做不完P(guān)PT。
PPT生成的內(nèi)容和上傳文件關(guān)聯(lián)性很高,基本上把文檔重點(diǎn)都劃出來(lái)了,直接拿來(lái)用問(wèn)題也不大。

簡(jiǎn)單總結(jié)一下,通義這波上新的PPT創(chuàng)作,具有以下幾個(gè)優(yōu)點(diǎn):
- 言之有物:做到了生成文本更像人話(去AI味),并且不是片湯話,能結(jié)合用戶需求和上傳文件輸出有信息量的PPT內(nèi)容。
- 模板豐富:提供了各個(gè)不同場(chǎng)景、行業(yè)適用的PPT模板,設(shè)計(jì)美觀,大學(xué)生到上班族都能用。
- 智能編排:提供了全流程智能編排的能力,可在線實(shí)時(shí)調(diào)整PPT模板編排、PPT配圖智能生成、PPT文本智能改寫(xiě)等。
量子位進(jìn)一步扒拉了一下,通義PPT背后的基礎(chǔ)模型是通義千問(wèn)大模型2.5,相比上一版本,Qwen 2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%,性能超越GPT-4 Turbo。
在對(duì)長(zhǎng)文檔的支持方面,通義PPT支持1000萬(wàn)字長(zhǎng)文檔,包括PPT、PDF和網(wǎng)頁(yè)。
多模態(tài)方面,支持上傳最長(zhǎng)6小時(shí)的音頻、視頻,也可以輸入鏈接導(dǎo)入線上音視頻。

文生圖功能,則是引入了通義萬(wàn)相的能力。
三合一“通義效率”
值得一提的是,與PPT創(chuàng)作共同存在于通義效率版塊的,還有另外兩個(gè)功能:
實(shí)時(shí)記錄,以及閱讀助手。

不說(shuō)不知道,這兩者其實(shí)都是通義用戶的老朋友。
實(shí)時(shí)記錄,原通義聽(tīng)悟,是音視頻內(nèi)容方面的AI助手。
應(yīng)用場(chǎng)景聚焦課堂記錄、會(huì)議記錄,能完成的工作,包括語(yǔ)音轉(zhuǎn)文字、發(fā)言人區(qū)分、智能總結(jié)等。
界面非常簡(jiǎn)潔,選擇語(yǔ)言(能識(shí)別中、英、日三種語(yǔ)言),確定需不需要實(shí)時(shí)翻譯成中文,即可開(kāi)始在線錄音。
外教課or國(guó)際會(huì)議,不用愁了。

在通義實(shí)時(shí)記錄,錄音是實(shí)時(shí)的,語(yǔ)音轉(zhuǎn)文字是實(shí)時(shí)的,英文/日語(yǔ)錄音轉(zhuǎn)譯成中文是實(shí)時(shí)的。
連邊轉(zhuǎn)文字邊修正錯(cuò)別字,也是實(shí)時(shí)的。
是真的很實(shí)時(shí)(手動(dòng)狗頭)。
不僅可以很好地區(qū)分發(fā)言人,根據(jù)不同發(fā)言人整理核心觀點(diǎn),而且,用戶可以邊聽(tīng)邊選中文段,自己劃重點(diǎn)。
邊開(kāi)會(huì)邊做會(huì)議紀(jì)要,不是夢(mèng)。

整個(gè)界面的右側(cè)板塊,是用來(lái)寫(xiě)寫(xiě)畫(huà)畫(huà)自個(gè)兒做筆記的部分。
當(dāng)錄音結(jié)束后,這一板塊會(huì)劃分成三個(gè)區(qū)域:
? 導(dǎo)讀:對(duì)錄音內(nèi)容進(jìn)行AI總結(jié),包括摘要、章節(jié)速覽、待辦事項(xiàng)等;
? 腦圖:根據(jù)錄音內(nèi)容整理出思維導(dǎo)圖,幫助快速掌握會(huì)議要點(diǎn)和脈絡(luò);
? 筆記:顧名思義,是錄音過(guò)程中用戶自己記錄下的內(nèi)容。

關(guān)于實(shí)時(shí)記錄,最后來(lái)劃個(gè)重點(diǎn):支持每天20小時(shí)的錄制撰寫(xiě)時(shí)長(zhǎng),使用免費(fèi)!還是免!費(fèi)!

閱讀助手,功能等同于原來(lái)的通義智文。
上來(lái)就先告訴你,與實(shí)際記錄一樣,它同樣是免費(fèi)的。
在閱讀助手,各種格式的文檔/論文/圖書(shū),包括PDF(含掃描件)、word、圖片、HTML、Markdown、EPUB、Mobi,無(wú)論是網(wǎng)頁(yè)鏈接還是播客鏈接,都能被精準(zhǔn)速讀。
而且,超多格式伴隨著超大容量——
文檔,可以是長(zhǎng)達(dá)1000萬(wàn)字的;音頻視頻,可以是6小時(shí)起步的。
非常Nice。

上手測(cè)試過(guò)程中,我們喂給了它兩本書(shū),分別是193頁(yè)、英文版的《我們賴以生存的隱喻》,和500頁(yè)、中文版的《埃隆·馬斯克傳》。
首先,很關(guān)鍵的一個(gè)功能是閱讀助手支持全文翻譯,翻譯速度還很快,幾乎不用等。
對(duì)經(jīng)常讀外文文獻(xiàn)的朋友們來(lái)說(shuō),真的非常友好。
其次,AI提煉出的導(dǎo)讀部分,也會(huì)翻譯成中文呈現(xiàn)。
這一部分由全文概述、關(guān)鍵要點(diǎn)、速度導(dǎo)覽等組成;如果丟給它的是論文,還會(huì)有論文速讀(核心要點(diǎn)總結(jié))、論文總結(jié)(文章優(yōu)點(diǎn)、方法創(chuàng)新點(diǎn)、未來(lái)展望),幫助用戶快速理解內(nèi)容。

如果嫌棄導(dǎo)讀還是太長(zhǎng)?
沒(méi)關(guān)系,指路旁邊的腦圖,分分鐘厘清主要脈絡(luò)。

更有意思的是,在閱讀助手里,用戶能針對(duì)原文劃詞解讀,輔助理解關(guān)鍵點(diǎn)。
可以選擇在板塊底部的對(duì)話框,問(wèn)出所有你不明白不理解的文檔相關(guān)問(wèn)題。
這個(gè)功能約等于“讓死的論文活過(guò)來(lái)交流探討”。

如此這般,實(shí)時(shí)記錄、閱讀助手、PPT創(chuàng)作,形成了三合一的通義效率。
實(shí)時(shí)記錄功能能夠迅速捕捉并保存每一個(gè)重要信息;
閱讀助手則是輔助位,幫助在知識(shí)中篩選、提煉,讓用戶短時(shí)間內(nèi)掌握核心要義;
而PPT創(chuàng)作則能借用大模型的AI能力將散落的信息整理成富有邏輯性和視覺(jué)沖擊力的展示材料。
這三者相輔相成,共同構(gòu)成了一個(gè)從信息整理、閱讀理解到內(nèi)容創(chuàng)作的完整工作學(xué)習(xí)流程;每一步環(huán)環(huán)相扣,不管是面對(duì)工作還是學(xué)習(xí),都能事半功倍。
大模型應(yīng)用想卷,得靠技術(shù)和體驗(yàn)
上面提到的三個(gè)功能,都可以在PC端絲滑使用。
多說(shuō)一嘴,除了PPT創(chuàng)作,另外兩個(gè)功能還能在手機(jī)端體驗(yàn)。
“我們希望通過(guò)這些工具幫助用戶節(jié)省時(shí)間,提升工作學(xué)習(xí)效率,激發(fā)無(wú)限創(chuàng)意。”通義效率產(chǎn)品經(jīng)理王曉明表示,未來(lái)圍繞工作學(xué)習(xí)場(chǎng)景,通義會(huì)持續(xù)幫用戶用AI技術(shù)提效。

通義效率背后,正是基于強(qiáng)大的通義大模型。
阿里旗下通義千問(wèn)大模型聚焦開(kāi)源路線,家族陣容龐大,是國(guó)內(nèi)的頭部梯隊(duì)玩家,在多個(gè)全球評(píng)測(cè)榜單上也常常名列前茅。
通義近期發(fā)布了全球性能最強(qiáng)的開(kāi)源模型Qwen2-72B,該模型提升了代碼、數(shù)學(xué)、推理、指令遵循、多語(yǔ)言理解等能力。多個(gè)國(guó)內(nèi)外榜單顯示,Qwen2-72B成為排名第一的中國(guó)大模型,也是全球最強(qiáng)的開(kāi)源模型。
長(zhǎng)期耕耘得來(lái)的技術(shù)優(yōu)勢(shì),為通義效率提供了源源不斷的創(chuàng)新動(dòng)力。
而三合一整合后推出的通義效率,精準(zhǔn)地圍繞工作學(xué)習(xí)流程,將信息整理、閱讀理解到內(nèi)容創(chuàng)作這三大功能進(jìn)行了無(wú)縫打通,形成了一個(gè)高效的工作學(xué)習(xí)閉環(huán)。
這一閉環(huán)不僅能夠激發(fā)用戶的創(chuàng)意思維,還能夠顯著提升工作效率。
更為重要的是,通義效率率先將這些功能全部實(shí)現(xiàn)在PC端,真正做到了“需求在哪里,效率就在哪里發(fā)揮作用”。
這種以用戶需求為導(dǎo)向的設(shè)計(jì)理念,使得通義效率在提升用戶工作效率的同時(shí),也極大地增強(qiáng)了用戶體驗(yàn)。

當(dāng)然了,換個(gè)視角來(lái)看,通義上線“效率”的背后,其實(shí)反映了市場(chǎng)的選擇和趨勢(shì)——
大模型的應(yīng)用正在朝著智能化、個(gè)性化、一站式、高效率、少人工的方向發(fā)展。
這正是大模型在應(yīng)用層面的本質(zhì)體現(xiàn)。
隨著大模型日益融入大眾的日常生活,用戶在入門(mén)上手之后,追求的便是更加卓越的體驗(yàn)。
如果技術(shù)不夠先進(jìn),體驗(yàn)不夠優(yōu)秀,那么就容易被用戶和市場(chǎng)所拋棄。
因此,大模型的應(yīng)用落地和推廣,必須走向更實(shí)用、更好用的方向。
實(shí)際上,我們正在見(jiàn)證這一趨勢(shì)的發(fā)生,通義效率的選擇,就是最好的證明之一。
它告訴我們,應(yīng)用落地和推廣,只有真正滿足用戶需求,提供優(yōu)質(zhì)體驗(yàn)的產(chǎn)品,才能在AI 2.0的模型與應(yīng)用大潮中站穩(wěn)腳跟。
- DeepSeek-V3.2-Exp第一時(shí)間上線華為云2025-09-29
- 你的AI助手更萬(wàn)能了!天禧合作字節(jié)扣子,解鎖無(wú)限新功能2025-09-26
- 你的最快安卓芯片發(fā)布了!全面為Agent鋪路2025-09-26
- 任少卿在中科大招生了!碩博都可,推免學(xué)生下周一緊急面試2025-09-20



