注意，有場(chǎng)景的公司正在拿起AI武器

乾明

雷剛 2019-04-12 14:56:48 來源：量子位

將AI融入“血液”。

李根乾明發(fā)自凹非寺

量子位報(bào)道 | 公眾號(hào) QbitAI

潮水轉(zhuǎn)關(guān)，并非毫無征兆。

不知道AI落地趨勢(shì)變化是否已讓你感知？2018年下半年開始，技術(shù)先發(fā)正在被產(chǎn)品、場(chǎng)景為王替代。

之前，打造通用AI技術(shù)公司風(fēng)頭無兩。如今，垂直化場(chǎng)景公司拿起AI武器，數(shù)據(jù)和場(chǎng)景加速轉(zhuǎn)換為勢(shì)能。

今天要講的是一樁在線教育領(lǐng)域的AI變革。

一起作業(yè) → 一起教育科技

一起教育科技，之前更為大眾知的是一起作業(yè)，一家主打K12進(jìn)校的教育公司，提供的是互聯(lián)網(wǎng)在線作業(yè)和練習(xí)系統(tǒng)。

從2018年起，升級(jí)更名，以一起教育科技行世。

名頭更大，意味著想得更大、做得更多，更多科技賦能產(chǎn)業(yè)。

而這個(gè)科技，最核心的就是AI，唯有AI，才能實(shí)現(xiàn)他們智能化教育的目標(biāo)。

實(shí)際上，在E輪2.5億美元融資之前，他們就已于2017年年末組建了AI團(tuán)隊(duì)，并從微信團(tuán)隊(duì)挖來負(fù)責(zé)人。

即便“一起”搞AI算不上早，但也并非沒有優(yōu)勢(shì)。

歷經(jīng)7年創(chuàng)業(yè)，用戶規(guī)模7900萬，K12領(lǐng)域的數(shù)據(jù)資源更是壁壘深厚。

這不，牛刀初試便鋒芒外露。

去年下半年，他們對(duì)外推出一款A(yù)I口語評(píng)測(cè)引擎，用于K12領(lǐng)域口語測(cè)評(píng)打分。

之前，行業(yè)內(nèi)有技術(shù)領(lǐng)域出發(fā)的先發(fā)產(chǎn)品，涵蓋訊飛、思必馳、云知聲和騰訊等玩家。

但一起這個(gè)引擎，一出手便展現(xiàn)場(chǎng)景公司威力——在橫向?qū)Ρ戎校瑩魯∷型愴?xiàng)。

How？

亮結(jié)果

一起教育科技展示了由業(yè)內(nèi)教育專家組織的評(píng)測(cè)結(jié)果。

評(píng)測(cè)涉及兩個(gè)方面，分別是句子層面和單詞層面，核心指標(biāo)是分?jǐn)?shù)分布和分差分布。

分?jǐn)?shù)分布指的是口語評(píng)測(cè)引擎為樣本打分的情況。分差分布代表的是引擎打分與人類專家打分的差。

在分?jǐn)?shù)分布上，一起教育科技的引擎在單詞和句子上的打分，與其他各家更趨近人類專家的水平。

分差分布上，一起教育科技自研的引擎表現(xiàn)也很亮眼。

在單詞層面，分差在0~1之間的概率近70%。

句子層面上，分差在0~1之間的概率達(dá)到80%，比排在其后的競(jìng)品高出10個(gè)百分點(diǎn)。

一起教育科技透露，整個(gè)評(píng)測(cè)過程實(shí)際也是“人機(jī)大戰(zhàn)”：

首先是從數(shù)據(jù)庫中隨即抽取1000個(gè)語音樣本，有詞，有短語，也有句子。
其次邀請(qǐng)兩位人類專家雙盲交叉評(píng)分（8分制），并力爭一致性在90%以上。
同時(shí)進(jìn)行的還有各家AI對(duì)該評(píng)測(cè)數(shù)據(jù)的打分。
最后比較AI給分和人類專家給分的分差——分差越小，AI引擎越好。
于是有了這份結(jié)果。

為什么要這樣測(cè)？

一起教育科技方面解釋，一方面是基于K12教學(xué)大綱進(jìn)行考察，要涵蓋音素準(zhǔn)確率、內(nèi)容完整度、流利度、重音、韻律(語調(diào)，停頓)等。

另一方面符合國人學(xué)英語的習(xí)慣，如果AI引擎直接按照標(biāo)準(zhǔn)國際口語打造，最后就會(huì)與人類專家打分出入很大——國情和語言環(huán)境所限，AI評(píng)測(cè)首要問題是“聽懂”，才能精確打分。

這實(shí)際上并非輕而易舉。

達(dá)成如此結(jié)果，背后不僅有一支類似教AlphaGo下棋的圍棋國手們，也有一支50多人規(guī)模的AI作戰(zhàn)團(tuán)，且整個(gè)打造過程歷時(shí)2年之久。

為什么這么久？

模型打造挑戰(zhàn)

口語測(cè)評(píng)與語音識(shí)別等一般的機(jī)器學(xué)習(xí)問題不同，是一個(gè)主觀性的問題，需要考慮到評(píng)分的標(biāo)準(zhǔn)，以及評(píng)分的一致性。

這對(duì)于模型的穩(wěn)定性提出了更高的要求。尤其是在作業(yè)和考試場(chǎng)景，對(duì)打分的準(zhǔn)確率要求更高。

種種因素決定，自研口語測(cè)評(píng)引擎，并不能簡單地將通用聲學(xué)模型搬來套用，而是要針對(duì)具體場(chǎng)景構(gòu)建模型。

相對(duì)于其他各家來說，一起教育科技的口語測(cè)評(píng)引擎，不論是在模型上、標(biāo)準(zhǔn)上，還是在訓(xùn)練數(shù)據(jù)上，都更加專注于K12教育場(chǎng)景。

口語測(cè)評(píng)的任務(wù)中，語音對(duì)應(yīng)的文字，引擎是事先知道的，其關(guān)鍵任務(wù)就是給用戶的語音做一個(gè)精確的評(píng)價(jià)。

通常情況，語音識(shí)別的聲學(xué)模型，都是基于音素（phoneme）來構(gòu)建的。

但進(jìn)行口語測(cè)評(píng)，對(duì)用戶的發(fā)音要求比較高，如果單獨(dú)看某些音素（清輔音），并不能準(zhǔn)確給出評(píng)估。

一起教育科技的解決方案是，構(gòu)建基于音素和音節(jié)(syllable)的聲學(xué)模型，對(duì)于無法單獨(dú)評(píng)估的因素，將其置于音節(jié)之中，結(jié)合場(chǎng)景給出評(píng)估。

在評(píng)估發(fā)音準(zhǔn)確度方面，業(yè)界通常采用的是GOP (Goodness of Pronunciation) 算法。

這一算法的核心，是計(jì)算用戶發(fā)出的語音與系統(tǒng)已知文字對(duì)應(yīng)的可能性。可能性越高，發(fā)音就越準(zhǔn)確。

這個(gè)可能性，就是系統(tǒng)已知發(fā)音和未知發(fā)音的似然比（likelihood ratio）。

似然比的計(jì)算，通常基于聲學(xué)模型。大部分成熟的聲學(xué)模型，使用的訓(xùn)練數(shù)據(jù)通常都是都是英語為母語的人的錄音。

對(duì)于發(fā)音水平較好的學(xué)生，GOP算法能夠給出一個(gè)相對(duì)準(zhǔn)確的評(píng)估。

但對(duì)于發(fā)音較差、中式英語痕跡很重的學(xué)生，其似然比區(qū)分度很低，這個(gè)算法就很難奏效。

對(duì)于這個(gè)問題，一起教育科技采用兩個(gè)解決辦法。

首先是訓(xùn)練模型的數(shù)據(jù)，來自于自己收集的作業(yè)數(shù)據(jù)，經(jīng)由教研團(tuán)隊(duì)仔細(xì)標(biāo)注。目前，一起教育科技已經(jīng)積累了萬小時(shí)級(jí)別的口語數(shù)據(jù)集。

其次是評(píng)分標(biāo)準(zhǔn)，只是將GOP算法作為其中的一個(gè)維度。在構(gòu)建評(píng)分決策樹中，集成了更多其他符合K12教學(xué)場(chǎng)景的特征。

比如長元音和短元音應(yīng)該怎么去分析、音素錯(cuò)誤的位置對(duì)評(píng)分產(chǎn)生什么樣的影響，等等。

這些特征，由教研團(tuán)隊(duì)從教學(xué)大綱和口考標(biāo)準(zhǔn)中提煉而出，既符合教學(xué)目標(biāo)，技術(shù)上也有可行性。

評(píng)分標(biāo)準(zhǔn)更加細(xì)化，也減少了模型訓(xùn)練時(shí)對(duì)數(shù)據(jù)的需求。目前，口語測(cè)評(píng)引擎已經(jīng)融入到了一起教育科技的產(chǎn)品之中。

一起教育科技介紹稱，引擎每天承接的請(qǐng)求量達(dá)到億級(jí)，用戶對(duì)于引擎打分不準(zhǔn)的建議率在萬分之幾的水平。

將AI融入“血液”

不過，這只是序幕而已。

一起教育科技的壯志雄心，不止于口語測(cè)評(píng)。2017年，“一起”從微信模式識(shí)別中心挖來饒豐組建AI團(tuán)隊(duì)，當(dāng)時(shí)就有短中長規(guī)劃。

第一步，先從語音是識(shí)別入手，解決英語學(xué)科測(cè)評(píng)打分的老師痛點(diǎn)。

第二步，圍繞圖像領(lǐng)域展開，推出口算拍照等產(chǎn)品，且對(duì)數(shù)學(xué)試題中的“邏輯”能有清晰理解。

此外，還有推薦引擎機(jī)制，通過智能化推薦方式，實(shí)現(xiàn)千人千面、因材施教，讓學(xué)生在測(cè)試中不斷完善短板。

目前，一起教育科技已經(jīng)組建起一只能打好用的AI團(tuán)隊(duì)。

未來目標(biāo)是能夠打造完美AI助教，讓AI真正實(shí)現(xiàn)賦能教育。

優(yōu)勢(shì)也很明顯，在“一起”，教育場(chǎng)景能不斷給AI模型反饋，而AI則能第一時(shí)間落地作用于教育，循環(huán)往復(fù)，生生不息。

當(dāng)然，對(duì)于一起教育科技來說，AI只是“科技”的一部分。

去年第四季度，他們從奇虎360挖來前搜索事業(yè)部總經(jīng)理?xiàng)羁祿?dān)任技術(shù)總負(fù)責(zé)人，負(fù)責(zé)將公司進(jìn)一步科技化，打造K12智能教育平臺(tái)。

注意，有場(chǎng)景的公司正在拿起AI武器

△楊康

這位前360的No.53號(hào)員工，擁有十多年的研發(fā)及業(yè)務(wù)管理經(jīng)驗(yàn)。

他說，一起教育科技，教育在前科技在后，“一起”的核心著力始終是教育，但科技會(huì)是最佳手段，能夠幫助教育不斷提升效率降低成本。

除了AI團(tuán)隊(duì)，一起教育科技還有大數(shù)據(jù)等團(tuán)隊(duì)，希望把7年深耕教育獲得的數(shù)據(jù)更好歸因、分類，然后更好使用。

在楊康看來，目前教育最大問題并不是內(nèi)容匱乏，而是很難給每個(gè)孩子找到適合自己情況的學(xué)習(xí)方式與思維方式。

AI與大數(shù)據(jù)的結(jié)合，能夠很好地解決這個(gè)問題，這能夠?yàn)槊總€(gè)學(xué)生打造一個(gè)“私人助教”，而非“大班制教學(xué)”走馬觀花式學(xué)習(xí)。

在他們內(nèi)部，首先是數(shù)據(jù)帶動(dòng)信息化，其次是AI等模型引擎作用其中，最后以智能化產(chǎn)品發(fā)揮更大價(jià)值。

毫無疑問，這也會(huì)是整個(gè)教育行業(yè)的趨勢(shì)。

這個(gè)趨勢(shì)已經(jīng)開始，這個(gè)趨勢(shì)不會(huì)停止。

版權(quán)所有，未經(jīng)授權(quán)不得以任何形式轉(zhuǎn)載及使用，違者必究。

AI教育一起教育

乾明

注意，有場(chǎng)景的公司正在拿起AI武器

相關(guān)閱讀

人在坐，AI在看

豆神教育發(fā)布“超擬人”AI導(dǎo)師，語言文學(xué)教育賽道迎來革新

教育大模型迎來新玩家：十年深耕劍指智適應(yīng)，25道題能測(cè)1000個(gè)知識(shí)點(diǎn)

小猿亮相2025服貿(mào)會(huì) ?全系智能軟硬件引領(lǐng)“教育AI”融合新路徑

中國公司再獲KDD兩項(xiàng)最佳：松鼠AI拿下圖深度學(xué)習(xí)研討會(huì)最佳論文&最佳學(xué)生論文

粉筆CTO：大模型打破教育「不可能三角」，因材施教真正成為可能｜中國AIGC產(chǎn)業(yè)峰會(huì)

熱門文章

能講“悄悄話”的智能助理，瑞聲科技助力夸克AI眼鏡S1開創(chuàng) 語音交互新范式

商湯分拆了一家AI醫(yī)療公司，半年融資10億，劍指“醫(yī)療世界模型”

前端沒死，AI APP正在返祖

寧德時(shí)代給9萬+基層員工漲了薪！每月150元

云計(jì)算一哥10分鐘發(fā)了25個(gè)新品！Kimi和MiniMax首次上桌