實測Qwen-MT翻譯模型,確實又快又好
但果然無法理解雙語諧音笑話
不圓 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
Qwen最近屬實聲勢不小,開源方面剛靠Qwen3-Coder炸場,在翻譯領(lǐng)域也卷出花:
更快響應(yīng)速度、更低價格,阿里云百煉最新翻譯模型Qwen-MT現(xiàn)已開放,主打一個高性價比。
先看價格:

根據(jù)官方介紹,該模型的核心亮點包括:
- 支持超過92種主流官方語言及重要方言之間的高質(zhì)量互譯
- 提供術(shù)語干預(yù)、領(lǐng)域提示、記憶庫等專業(yè)翻譯功能,并支持用戶自定義提示
- 采用輕量級MoE架構(gòu),在保證卓越性能的同時實現(xiàn)更快的響應(yīng)速度和更低的API調(diào)用價格
該模型在自動評估和人工評估的翻譯任務(wù)中都取得了不錯的結(jié)果。



量子位實測:響應(yīng)速度很快,回譯準確性較高,可手動調(diào)整翻譯風(fēng)格。
讓我們看一下它的具體表現(xiàn)。
實測效果
我們調(diào)用了Qwen-MT-Turbo的API,在本地文檔中進行測試,詳細用法可見文末。
中英互譯
讓Qwen-MT把中文原句翻譯成英文,再把翻譯后的結(jié)果重譯為中文,用回譯檢驗的方法看看效果如何。
我們將逐漸提高句子的復(fù)雜程度,并在得到結(jié)果后總結(jié)翻譯的平均用時(中譯英+英譯中,使用了python的time模塊)。
當生命以美的形式證明其價值的時候,幸福是享受,痛苦也是享受。(史鐵生《我與地壇》)
中譯英:When life proves its value in the form of beauty, happiness is enjoyment, and suffering is also enjoyment.
英譯中:當生活以美麗的形式證明其價值時,快樂是享受,痛苦也是享受。
平均用時:0.71s
葉子本是肩并肩密密地挨著,這便宛然有了一道凝碧的波痕。葉子底下是脈脈的流水,遮住了,不能見一些顏色;而葉子卻更見風(fēng)致了。(朱自清《荷塘月色》)
中譯英:The leaves were originally closely packed side by side, and now they seemed to form a clear green wave-like pattern. Beneath the leaves flowed a gentle stream of water, obscuring any visible color; yet the leaves themselves appeared even more graceful.
英譯中:葉子原本緊密地并排生長,現(xiàn)在看起來卻形成了一道清晰的綠色波浪狀圖案。葉子下面流淌著一股柔和的水流,使任何顏色都難以辨認;然而,這些葉子本身卻顯得更加優(yōu)雅。
平均用時:0.86s
秦人不暇自哀,而后人哀之。后人哀之而不鑒之,亦使后人而復(fù)哀后人也。(杜牧《阿房宮賦》)
中譯英:The people of Qin did not have time to mourn for themselves, yet later generations mourned for them. If later generations mourn for them without learning from their mistakes, they will also cause future generations to mourn for them again.
英譯中:秦人沒有時間為自己哀悼,但后世卻為他們哀悼。如果后世哀悼他們卻不吸取他們的教訓(xùn),那么他們也會使后世再次為他們哀悼。
平均用時:0.77s
若夫日出而林霏開,云歸而巖穴暝,晦明變化者,山間之朝暮也。野芳發(fā)而幽香,佳木秀而繁陰,風(fēng)霜高潔,水落而石出者,山間之四時也。(歐陽修《醉翁亭記》)
中譯英:When the sun rises and the forest mist disperses, and when clouds return and the mountain caves darken, these changes between brightness and darkness mark the morning and evening in the mountains. When wild flowers bloom and emit a subtle fragrance, when fine trees flourish and cast abundant shade, when winds and frosts are crisp and clear, and when water recedes and rocks emerge—these are the four seasons of the mountains.
英譯中:當太陽升起,森林中的薄霧散去;當云朵歸來,山洞變得幽暗,這些明暗交替的變化標志著山間早晚的更替。當野花盛開,散發(fā)出淡淡的芬芳;當茂密的樹木繁盛,投下濃蔭;當風(fēng)霜清冽而明朗;當水位退去,巖石顯露出來——這些都是山間的四季。
平均用時:1.05s
名句對比
讓Qwen-MT把外國文學(xué)的原句翻譯成中文,和名家的翻譯結(jié)果進行對比,看看它對不同語言情境的把握。
我們選取了英語、俄語、西班牙語和拉丁語的名著原文及它們著名的譯本,自動識別語言,并記錄了每次翻譯的用時。
The trumpet of a prophecy! O Wind, If Winter comes , can Spring be far behind?(雪萊《西風(fēng)頌》)
穆旦譯文:把昏睡的大地喚醒吧!要是冬天已經(jīng)來了,西風(fēng)呵,春日怎能遙遠?
翻譯結(jié)果:預(yù)言的號角!啊,風(fēng)啊,冬天來了,春天還會遠嗎?
用時:0.65s
To be, or not to be -that is the question.Whether ’tis nobler in the mind to suffer the slings and arrows of outrageous fortune, Or to take arms against a sea of troubles, and by opposing end them??(莎士比亞《哈姆雷特》經(jīng)典獨白)
朱生豪譯文:生存還是毀滅,這是一個值得考慮的問題;默然忍受命運暴虐的毒箭,或是挺身反抗人世無涯的苦難,通過斗爭把它們掃個干凈,這兩種行為,哪一種更加高尚?
翻譯結(jié)果:生存還是毀滅,這是一個問題。是默默忍受命運的無情打擊,還是挺身反抗人世間的種種苦難,以斗爭來終結(jié)它們?
用時:0.86s
Muchos a?os después, frente al pelotón de fusilamiento, el coronel Aureliano Buendía había de recordar aquella tarde remota en que su padre lo llevó a conocer el hielo.(馬爾克斯《百年孤獨》開頭)
范曄譯文:多年以后,面對行刑隊,奧雷里亞諾?布恩迪亞上校將會回想起父親帶他去見識冰塊的那個遙遠的下午。
翻譯結(jié)果:多年以后,在行刑隊面前,奧雷連諾上校將想起那個遙遠的下午,那時他的父親帶他去見識冰塊。
用時:0.74s
Счастливая семья всем таким же, несчастливая семья соответственно имеет разницу фактическ!(托爾斯泰《安娜卡列尼娜》開頭)
草嬰譯文:幸福的家庭家家相似,不幸的家庭各各不同。
翻譯結(jié)果:幸福的家庭都一樣,不幸的家庭各有各的不幸!
用時:0.66s
Nondum amabam, et amare amabam; quaerebam quid amarem, amans amare.(奧古斯丁《懺悔錄》)
周士良譯文:我還沒有愛上誰,卻已愛上了‘愛情’本身;我追求愛的對象,為的是能沉醉于愛中。
翻譯結(jié)果:我尚未愛,卻已渴望去愛;我正愛著,便在尋求自己所愛之物。
用時:1.00s
長文本翻譯
讓Qwen-MT把長篇文本(百字以上)進行翻譯,看看它對長段文字的處理能力。
以英譯中為例,我們選取了通俗小說、科研論文兩種類型的長篇文本,并記錄翻譯用時。
It was the best of times, it was the worst of times, it was the age of wisdom, it was the age of foolishness, it was the epoch of belief, it was the epoch of incredulity, it was the season of Light, it was the season of Darkness, it was the spring of hope, it was the winter of despair, we had everything before us, we had nothing before us, we were all going direct to Heaven, we were all going direct the other way—in short, the period was so far like the present period, that some of its noisiest authoritiesinsisted on its being received, for good or for evil, in the superlativedegree of comparisononly.
翻譯結(jié)果:這是最好的時代,也是最壞的時代;這是智慧的年代,也是愚蠢的年代;這是信仰的紀元,也是懷疑的紀元;這是光明的季節(jié),也是黑暗的季節(jié);這是希望之春,也是絕望之冬;我們面前應(yīng)有盡有,我們面前一無所有;我們?nèi)贾北继焯茫覀円踩贾北枷喾吹姆较颉傊莻€時期與現(xiàn)在的時期如此相似,以至于一些最吵鬧的權(quán)威人士堅持認為,無論好壞,都必須以最高級的比較方式來對待它。
用時:1.30s
Large Language Models (LLMs) exhibit considerable promise in financial applications; however, prevailing models frequently demonstrate limitations when confronted with scenarios that necessitate sophisticated reasoning capabilities, stringent trustworthiness criteria, and efficient adaptation to domain-specific requirements. We introduce the Agentar-Fin-R1 series of financial large language models (8B and 32B parameters), specifically engineered based on the Qwen3 foundation model to enhance reasoning capabilities, reliability, and domain specialization for financial applications. Our optimization approach integrates a high-quality, systematic financial task label system with a comprehensive multi-layered trustworthiness assurance framework. This framework encompasses high-quality trustworthy knowledge engineering, multi-agent trustworthy data synthesis, and rigorous data validation governance. Through label-guided automated difficulty-aware optimization, tow-stage training pipeline, and dynamic attribution systems, we achieve substantial improvements in training efficiency. Our models undergo comprehensive evaluation on mainstream financial benchmarks including Fineva, FinEval, and FinanceIQ, as well as general reasoning datasets such as MATH-500 and GPQA-diamond. To thoroughly assess real-world deployment capabilities, we innovatively propose the Finova evaluation benchmark, which focuses on agent-level financial reasoning and compliance verification. Experimental results demonstrate that Agentar-Fin-R1 not only achieves state-of-the-art performance on financial tasks but also exhibits exceptional general reasoning capabilities, validating its effectiveness as a trustworthy solution for high-stakes financial applications. The Finova bench is available at this https URL.
翻譯結(jié)果:大型語言模型(LLMs)在金融應(yīng)用中展現(xiàn)出巨大的潛力,然而現(xiàn)有的模型在面對需要復(fù)雜推理能力、嚴格可信度標準以及高效適應(yīng)特定領(lǐng)域需求的場景時,往往表現(xiàn)出局限性。我們推出了Agentar-Fin-R1系列金融大語言模型(參數(shù)量分別為8B和32B),該系列模型基于Qwen3基礎(chǔ)模型專門設(shè)計,旨在提升金融應(yīng)用中的推理能力、可靠性和領(lǐng)域?qū)I(yè)性。我們的優(yōu)化方法結(jié)合了高質(zhì)量的系統(tǒng)化金融任務(wù)標簽體系與全面的多層次可信度保障框架。這一框架包括高質(zhì)量的可信知識工程、多智能體可信數(shù)據(jù)合成以及嚴格的數(shù)據(jù)驗證治理機制。通過標簽引導(dǎo)的自動化難度感知優(yōu)化、兩階段訓(xùn)練流程以及動態(tài)歸屬系統(tǒng),我們在訓(xùn)練效率上取得了顯著提升。我們的模型在主流金融基準測試(如Fineva、FinEval、FinanceIQ)以及通用推理數(shù)據(jù)集(如MATH-500和GPQA-diamond)上進行了全面評估。為了深入評估其實際部署能力,我們創(chuàng)新性地提出了Finova評測基準,專注于代理級別的金融推理和合規(guī)性驗證。實驗結(jié)果表明,Agentar-Fin-R1不僅在金融任務(wù)上達到了最先進的性能,還展現(xiàn)了卓越的通用推理能力,證明了其作為高風(fēng)險金融應(yīng)用可信解決方案的有效性。Finova基準測試可在以下網(wǎng)址獲取:https URL。
用時:2.46s
自然語言理解
我們試著在一段連續(xù)文本中加入一些錯別字,以及一些雙關(guān)的網(wǎng)絡(luò)流行梗,采用回譯檢驗(中譯英譯中)的方法測試Qwen-MT能否成功識別正確的意思。
我是童臉狼,表面上單純天真,實際上圓滑通透。你不可能算計得了我,因為從一開始你就被我布局了。我是棋手,而你只是棋子,若你偉逆我,你會道什么是殘酷和黑暗。當我重臨世界之日,諸逆臣皆當死去!
翻譯結(jié)果:我是童蓮瑯,表面上天真單純,實則精明敏銳。你們無法欺騙我,因為從一開始,我就已經(jīng)為你設(shè)下了計劃。我才是棋手,而你只是棋子;如果你與我為敵,你終將明白什么是真正的殘酷與黑暗。當我重返這個世界之日,所有叛徒必將死無葬身之地!
平均用時:1.14s
歇斯底里是崩潰,底里歇斯是美味。
翻譯結(jié)果:歇斯底里是崩潰,而歇斯底里是美妙的。
平均用時:0.60s
皇帝感嘆道:“孤的勝,你們都看在眼里,孤的敗。”然后就退朝了。
翻譯結(jié)果:皇帝嘆息道:“你們都曾見證過我的勝利,現(xiàn)在就看看我的失敗吧。”說完便退朝了。
平均用時:0.72s
自定義指令
Qwen-MT同時支持術(shù)語干預(yù)、自定義指令、翻譯記憶等功能,例如翻譯場景中有較多的專有詞匯,可以提前指定這些詞匯及翻譯結(jié)果,在程序內(nèi)建立字典。
還可以通過一段自然語言文本描述領(lǐng)域和要求,作為翻譯的提示。
我們輸入同樣的文本,要求Qwen-MT分別用嚴謹正式的直譯風(fēng)格和抒情美感的詩歌風(fēng)格進行翻譯,對比輸出結(jié)果。
A quiet threat to London’s position as a bustling world financial center is starting to show on the sweaty white collars of the city’s commuters.
嚴肅正式:倫敦作為全球金融中心的繁榮地位正面臨一個潛在的威脅,這種威脅開始在城市通勤者的汗?jié)癜最I(lǐng)中顯現(xiàn)出來。
抒情美感:倫敦作為全球金融中心的繁華地位,正悄然受到威脅,這種威脅已開始在城市通勤者們汗?jié)竦陌最I(lǐng)領(lǐng)帶上顯現(xiàn)。
用時:0.88s(嚴肅)/0.71s(抒情)
Some of us get dipped in flat, some in satin, some in gloss. But every once in while you find someone who’s iridescent, and when you do, nothing will ever compare. 嚴肅正式:我們有些人被浸在平滑中,有些人被浸在緞面中,有些人被浸在光澤中。但偶爾你也會遇到一些人,他們閃耀著彩虹般的光芒,一旦遇見了這樣的人,其他一切都將無法與之相比。
抒情美感:有人被歲月打磨得平滑如緞,有人則閃耀著光澤。但偶爾,你總會遇到那么一個光彩奪目的人,一旦遇見,便再也無法用其他事物來比擬。
用時:0.87s(嚴肅)/0.85s(抒情)
總體感受
速度很快,200字文本僅需2.5s,多數(shù)情況下輸出控制在1s以內(nèi)。
回流檢驗的結(jié)果和原文大致能夠保持一致,可以修正少量的錯別字,能夠理解文言文和俗語,但無法理解過于抽象的自然語言(如諧音梗笑話)。
能夠自動識別不同語言。
可以通過領(lǐng)域提示對輸出結(jié)果的語言風(fēng)格進行調(diào)整,但需要明確關(guān)鍵詞,領(lǐng)域提示語句暫時只支持英文。
使用方法
在阿里云百煉的模型廣場可以選擇試用Qwen-MT-Pro和Qwen-MT-Turbo。

選擇后即可試用,一次性可輸入的最長文本量為6000。

輸入內(nèi)容后進入對話界面,右側(cè)可選擇額外功能(術(shù)語干預(yù)、翻譯記憶、領(lǐng)域提示),每次輸出會顯示使用的token數(shù)。

也可以調(diào)用Qwen API,詳細代碼可見官方操作文檔。

結(jié)果支持流式輸出。

參考鏈接:https://mp.weixin.qq.com/s/2LQIrsaBgXcxw76BYshfdw
官方文檔:https://help.aliyun.com/zh/model-studio/machine-translation
API地址:https://bailian.console.aliyun.com/?tab=model#/model-market/detail/qwen-mt-turbo
— 完 —
量子位 QbitAI
關(guān)注我們,第一時間獲知前沿科技動態(tài)
- AI芯片獨角獸一年估值翻番!放話“三年超英偉達”,最新融資53億2025-09-18
- 李飛飛發(fā)布世界模型新成果:一個提示,生成無限3D世界2025-09-17
- 奧特曼“續(xù)命”大計:押注讓大腦變年輕的藥物,預(yù)計年底臨床試驗2025-09-16
- DeepMind哈薩比斯最新認知都在這里了2025-09-15




