GPT-4o用不上,國產(chǎn)平替海螺AI可以先試試
能聽、能寫、能說、能識(shí)圖
一水 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
AI領(lǐng)域本周都卷起來對(duì)話式交互。
前有OpenAI推出實(shí)時(shí)視頻通話如真人的GPT-4o,后有谷歌與之類似的Astra。
但不論是GPT-4o還是Astra,都或多或少有一些使用門檻。
也許是看到了這種gap,一款類似能力的國產(chǎn)AI應(yīng)用,也悄然更新了……

能力和體驗(yàn)上,可能跟GPT-4o和Astra演示的還有差距。
但作為門檻更友好的平替,也足夠了。
這款產(chǎn)品是國產(chǎn)大模型公司MiniMax的海螺AI,主打AI助手+實(shí)時(shí)語音聊天。
那么它有哪些具體應(yīng)用場(chǎng)景呢?
海螺AI能干什么?
海螺AI是MiniMax推出的一款多模態(tài)AI生產(chǎn)力工具,能聽、能寫、能說、能識(shí)圖。
概括而言,官方此次對(duì)這款產(chǎn)品作了如下更新:
- 多模態(tài)互動(dòng):海螺AI支持文本、音頻和圖像。用戶可以通過打字輸入、拍照識(shí)圖或語音通話與AI進(jìn)行互動(dòng)。
- 語音通話功能:海螺AI的一個(gè)顯著特點(diǎn)是支持語音交互。用戶可以直接與AI進(jìn)行語音通話,這在做飯、洗臉等不方便打字的情況下尤為方便。此外,這個(gè)功能還非常適合練習(xí)英語口語和模擬面試。
- 教育和職場(chǎng)應(yīng)用:海螺AI提供學(xué)習(xí)助手和工作助手功能。包括課程報(bào)告生成、知識(shí)點(diǎn)問答、作文輔導(dǎo)、背單詞、周報(bào)生成、工作匯報(bào)編寫等,適用于學(xué)生、教育者和職場(chǎng)人士。
- 內(nèi)容創(chuàng)作和數(shù)據(jù)處理:海螺AI支持生成多種社交媒體文案,如小紅書、短視頻腳本和公眾號(hào)文章等。同時(shí),它還能進(jìn)行智能搜索和數(shù)據(jù)查詢,幫助用戶獲取企業(yè)信息、金融數(shù)據(jù)和學(xué)術(shù)研報(bào)等。
(以下為原速實(shí)測(cè))
語音播報(bào)今日熱點(diǎn)
上下班開車途中,可以讓海螺AI播報(bào)今日熱點(diǎn),并隨意聊天。

讀論文、讀財(cái)報(bào)
接著來看一項(xiàng)日常學(xué)習(xí)工作都需要用到的能力——快速總結(jié)長文本。
直接拿最常見的學(xué)術(shù)論文和公司財(cái)報(bào)來試試。

△海螺AI總結(jié)論文
整體較為流暢,看來十幾頁的論文對(duì)它來說不算挑戰(zhàn)。
難度加碼!這一次我們喂給它有大量數(shù)據(jù)報(bào)表的公司財(cái)報(bào)。

△隨機(jī)選取華夏銀行今年1季度報(bào)告
免費(fèi)查數(shù)據(jù)
除了速讀長文本,作為一款A(yù)I助手,檢索并快速整合信息也是關(guān)鍵。
先就日常生活來說,我們來試試讓海螺AI做旅行攻略。
比如“從重慶出發(fā)前往深圳再去長沙的五天旅游規(guī)劃方案”。
短短幾個(gè)字估計(jì)能瞬間讓傾向于細(xì)致規(guī)劃的“J人”炸毛。

此外,海螺AI接入了天眼查、蘿卜投研和學(xué)科網(wǎng)等專業(yè)數(shù)據(jù)庫,能夠讓用戶免費(fèi)搜索專業(yè)數(shù)據(jù)。
隨便想了一個(gè)例子,“幫我查下量子位的工商數(shù)據(jù)”。

輔導(dǎo)作業(yè)
海螺AI還能幫助父母輔導(dǎo)孩子功課。
我們直接上傳一張小學(xué)數(shù)學(xué)應(yīng)用題常見的“相遇問題”。
可以看到,海螺AI按照步驟進(jìn)行了解答。(移動(dòng)端支持直接拍照上傳)

寫作
由于寫規(guī)劃、寫報(bào)告、寫文案等對(duì)幾乎所有AI來說都是常規(guī)操作,在此我們不再展示。
但是,當(dāng)我們驅(qū)散班味兒,想用AI寫作來搞副業(yè)時(shí),海螺AI能否派上用場(chǎng)?
讓我們直接提示它“幫我構(gòu)思一個(gè)職場(chǎng)女性黑化逆襲重生的爽文霸總劇本”。

英語口語陪練
海螺AI支持口語練習(xí),用戶可以用它來練雅思和托福、CET4/6、PET等。
小結(jié)
單從本周熱門的“對(duì)話式交互”來說,它和GPT-4o及Astra還存在一定差距。
這主要體現(xiàn)在:
- 海螺AI能聽能說,但是不能看,無法像打視頻一樣感知周圍環(huán)境
- 當(dāng)海螺AI說話時(shí),無法通過語音溝通打斷,不過有一個(gè)暫停按鈕
- 海螺AI在實(shí)時(shí)能力上仍有提升空間,不過目前體驗(yàn)下來影響不大
總之,對(duì)于這樣一款能立即上手甚至免費(fèi)的國產(chǎn)AI來說,瑕不掩瑜,值得一試。
技術(shù)原理:自研多模態(tài)MOE大模型
對(duì)于海螺AI背后的技術(shù),更早之前,官方也有過披露,分為以下兩個(gè)方面:
萬億參數(shù)MoE大語言模型
今年4月,MiniMax推出了萬億MoE模型abab-6.5,并在其基礎(chǔ)上開發(fā)了生產(chǎn)力工具“海螺AI”。
根據(jù)MiniMax發(fā)布的技術(shù)報(bào)告,在各類核心能力測(cè)試中,abab-6.5接近 GPT-4、Claude 3 Opus 、Gemini 1.5 Pro等世界領(lǐng)先的大語言模型。

MiniMax語音大模型
另外,海螺AI還接入了MiniMax語音大模型——speech-01。
這一模型的主要特色是:
- 高度接近人聲,且能用聲音表達(dá)情感
- 可模仿數(shù)千個(gè)聲音的音色特征,并生成聲音變體
- 支持30秒克隆音色
首先,官方稱海螺AI可以很好的理解人類的語言、語氣、情感。
讓我們整蠱一下小海螺。
要求它在同一句話里表達(dá)出喜怒哀樂等情緒,看看能否聽出明顯差別。
其次,官方稱海螺AI不僅限于模仿單一的聲音,它還能通過學(xué)習(xí)數(shù)千個(gè)聲音的音色特征,生成更多聲音變體。
目前它精通中文、英文、德文、法文等8國語言,還預(yù)置了30多種音色。

最后,官方稱海螺AI只需30秒的音頻樣本,就能快速復(fù)刻出與原音色高度相似的語音。
打造者:國內(nèi)獨(dú)角獸MiniMax
MiniMax是一家成立于2021年12月的人工智能初創(chuàng)公司,由前商湯科技副總裁、研究院副院長閆俊杰創(chuàng)立,成員主要來自商湯科技等知名AI公司。
△閆俊杰在2021世界人工智能大會(huì)算法典范總決賽上
2022年7月,MiniMax完成了Pre-A輪融資,投資方包括明勢(shì)資本和米哈游等。
2023年6月,MiniMax完成了一輪超過2.5億美元的融資,投資者包括與騰訊有關(guān)聯(lián)的實(shí)體。
今年3月,MiniMax的最新一輪融資由阿里巴巴領(lǐng)投,金額至少為6億美元,這使得公司估值超過25億美元。
目前,MiniMax主打三款產(chǎn)品,分別為MiniMax API開放平臺(tái)、沉浸式AI內(nèi)容社區(qū)星野、以及生產(chǎn)力工具海螺AI。
使用無門檻,歡迎回來給我們分享使用反饋呀。
體驗(yàn)地址:
海螺AI:https://hailuoai.com/ (支持移動(dòng)端應(yīng)用商店下載)



