色综合中文综合网_性猛交娇小69hd_久久精品99久久久久久_欧美日韩精品一区二区三区四区 _97视频色精品_国产高清精品久久久久_日日鲁鲁鲁夜夜爽爽狠狠视频97 _国产成人免费视频精品含羞草妖精 _熟女少妇在线视频播放_精品人妻一区二区三区麻豆91 _久久女同性恋中文字幕_一区二区福利视频

深探無監督預訓練技術落地 火山語音“算法優化+工程革新”兩手抓

核心思想在于用量化模塊將輸入特征離散化

一直以來,火山語音團隊都為時下風靡的視頻平臺提供基于語音識別技術的智能視頻字幕解決方案,簡單來說就是可以自動將視頻中的語音和歌詞轉化成文字,來輔助視頻創作的功能。但伴隨平臺用戶的快速增長以及對語言種類更加豐富多樣的要求,傳統采用有監督學習技術來解決的辦法日漸遭遇瓶頸,這讓團隊著實犯了難。

眾所周知,傳統的有監督學習會對人工標注的有監督數據產生嚴重依賴,尤其在大語種的持續優化以及小語種的冷啟動方面。以中文普通話和英語這樣的大語種為例,盡管視頻平臺提供了充足的業務場景語音數據,但有監督數據達到一定規模之后,繼續標注的ROI將非常低,必然需要技術人員考慮如何有效利用百萬小時級別的無標注數據,來進一步改善大語種語音識別的效果。

相對小眾的語言或者方言,由于資源、人力等原因,數據的標注成本高昂。在標注數據極少的情況下(10小時量級),有監督訓練的效果非常差,甚至可能無法正常收斂;而采購的數據往往和目標場景不匹配,無法滿足業務的需要。

為此火山語音團隊迫切需要研究如何以盡可能低廉的標注成本充分利用大量的無標注數據,提升少量標注數據下的識別效果并落地到實際業務中,所以無監督預訓練技術成為視頻平臺ASR(Automatic Speech Recognition / 自動語音識別)能力向小語種推廣的關鍵。

盡管近年來學術界在語音無監督預訓練領域取得了許多重大進展,包括Wav2vec2.0 [1]、HuBERT [2]等,但在工業界卻鮮有落地案例可以參考借鑒。整體來看,火山語音團隊認為,以下三方面主要原因,阻礙了無監督預訓練技術的落地:

  • 1. 模型參數量大、推理開銷大。大量無標注數據需要用較大的模型做無監督預訓練,才能得到高質量的語音表征,但這樣的模型如果直接部署到線上,會帶來高昂的推理成本。
  • 2. 無監督預訓練只關注語音表征的學習,需要結合大量純文本訓練的語言模型聯合解碼才能達到理想效果,和端到端ASR推理引擎不兼容。
  • 3. 無監督預訓練開銷大、周期長且不穩定。以Wav2vec2.0為例,300M參數量的模型用64張V100 GPU預訓練60萬步,耗時長達半個月;此外由于數據分布的差異,在業務數據上訓練容易發散。

對此火山語音團隊在基于無監督預訓練的語音識別技術落地過程中,針對以上三大痛點進行了算法改進和工程優化,形成一套完整易推廣的落地方案。本文將針對方案,從落地流程、算法優化以及工程優化等環節展開詳盡介紹。

落地流程

下圖是基于無監督預訓練的低資源語種ASR的落地流程,大致可以劃分為數據收集、種子模型訓練和模型遷移三個階段。

圖1 基于無監督預訓練的ASR落地流程

具體來說,第一階段的數據收集,可以通過語種分流、采購等手段收集目標語言的無標注語音、標注語音和純文本數據。

第二階段的種子模型訓練,也就是經典的“無監督預訓練+有監督微調”過程。這一階段將得到一個聲學模型,通常基于連接時序分類(Connectionist Temporal Classification, CTC [3])損失函數微調。聲學模型結合純文本訓練的語言模型,構成一個完整的語音識別系統,可以取得不錯的識別效果。之所以稱之為種子模型,是因為這個模型并不適合直接上線到業務,我們更傾向于使用LAS(Listen, Attend and Spell [4])或RNN-T(Recurrent Neural Network Transducer [5])這類端到端模型進行線上部署。

歸其原因,主要是LAS/RNN-T具有出色的端到端建模能力,同時在近年來已經取得了優于傳統CTC模型的效果,并在工業界得到越來越多的應用。火山語音團隊針對端到端語音識別模型的推理和部署做了大量優化工作,已形成一套相對成熟的方案,并支持眾多業務。在維持效果無損的前提下,如果可以沿用端到端推理引擎,就能大幅降低引擎的運維成本。

基于此團隊設計了第三階段,即模型遷移階段。主要借鑒知識蒸餾的思想,用種子模型對無標注數據打偽標簽,然后提供一個參數量較小的LAS模型做訓練,同步實現了模型結構的遷移和推理計算量的壓縮。整個流程的有效性在粵語ASR上得到驗證,具體實驗結果如下表所示:

首先,團隊采購了1kh成品數據用于實驗對比,直接訓練LAS模型性能不佳,字錯率(Character Error Rate, CER)高達44.2%。經過分析,火山語音認為主要原因是采購數據(對話)和業務測試集(視頻)領域不匹配,在wav2vec2.0上的初步實驗也發現了類似的現象。

相比用采購數據做預訓練,采用和目標領域一致的數據做預訓練,在業務測試集上的CER可以從42.0%下降到29.4%,于是團隊將業務場景的無標注數據積累到50kh,模型參數量從100M增加到300M,CER進一步下降到23.1%。

最后團隊驗證了模型遷移的效果,結合粵語語言模型對50kh無標注數據解碼得到偽標簽,訓練LAS模型。可以看到,基于偽標簽訓練的LAS模型基本可以保持CTC種子模型的識別效果且模型參數量減少了三分之一,可以直接基于成熟的端到端推理引擎部署上線。

圖2 模型參數量和CER對比

最終在模型結構和參數量不變的前提下,團隊用50kh無標注業務數據和10h有標注業務數據取得了23.0%的CER,相對基線模型下降48%。解決了線上計算量和兼容性的問題之后,聚焦到整個流程中最為核心的無監督預訓練技術,針對wav2vec2.0,火山語音團隊分別從算法和工程兩個維度進行了優化。

算法優化

wav2vec2.0作為Meta AI在2020年提出來的自監督預訓練模型,開啟了語音無監督表征學習的新篇章。其核心思想在于用量化模塊將輸入特征離散化,并通過對比學習優化,模型主體與BERT類似,隨機mask部分輸入特征。

版權所有,未經授權不得以任何形式轉載及使用,違者必究。

相關閱讀

在线欧美日韩精品| 成人在线视频一区| 男人天堂av片| 久久精品国产99| 麻豆精品蜜桃一区二区三区| 蜜桃av一区二区三区电影| 亚洲中文字幕无码一区二区三区| 欧美性一二三区| 2021亚洲天堂| 国偷自产av一区二区三区小尤奈| 亚洲国产精品一区二区www在线 | 国产日韩欧美二区| 欧美日韩高清影院| 99久久精品日本一区二区免费 | 欧美日韩成人黄色| 久久蜜桃一区二区| 9999热视频| 日本不卡二区高清三区| 亚洲动漫第一页| 亚洲欧美自拍视频| 国产欧美日韩小视频| 国产一区二区久久精品| 狠狠久久亚洲欧美| 精品无码在线视频| 成人免费观看网址| 亚洲va欧美va人人爽| 深夜福利影院在线观看| 国产精品视频公开费视频| 色综合一个色综合亚洲| 亚洲免费视频二区| 在线观看av日韩| 欧美日韩xxx| 国产精品美女久久久久aⅴ国产馆| 国产三级av片| av片中文字幕| 青草成人免费视频| 亚洲一区二区精品视频| 一级久久久久久久| 国产一伦一伦一伦| 91成人免费观看网站| 国产欧美一区二区精品性色| 久草视频中文在线| 精品久久久久久久久久中文字幕| 欧美成人精品xxx| 一区二区三区影院| 亚洲国产精品久久人人爱潘金莲 | 亚洲人成自拍网站| xfplay精品久久| 怡红院男人的天堂| 亚洲香蕉中文网| 相泽南亚洲一区二区在线播放| 亚洲一级一级97网| 亚洲一区视频在线观看视频| av在线亚洲天堂| 欧美熟妇精品一区二区蜜桃视频| 成人欧美一区二区三区视频| 欧美三级视频在线播放| 国产成人一级电影| 五月天婷婷导航| av在线网址导航| 国产激情美女久久久久久吹潮| 日韩精品在线免费观看视频| 一区二区三区小说| 久久精品国产久精国产| 欧美日韩一级大片| 黄色手机在线视频| 欧美大香线蕉线伊人久久| 国产视频一区在线| 欧美最猛性xxxxx直播| 成人精品在线视频观看| 午夜久久久久久久久久| 国产第一页精品| 中文字幕22页| www.一区二区.com| 精品欧美一区二区久久久伦| 久久中文久久字幕| 欧美中文一区二区三区| 久久久久国产成人精品亚洲午夜| 97超碰人人草| 最新日韩免费视频| 一区二区在线免费看| 影音先锋男人的网站| 国产美女高潮久久白浆| 中日韩午夜理伦电影免费| 欧美精品粉嫩高潮一区二区| 综合电影一区二区三区 | 日韩不卡免费视频| 国产精品一区二区电影| 欧美精品日韩www.p站| 日韩激情视频在线| 欧美一区二区精品久久911| 国产欧美一区二区三区在线看蜜臀 | 337p亚洲精品色噜噜狠狠p| 成人免费观看网站| 久久久视频在线| 亚洲乱码一区av黑人高潮| 91福利在线导航| 精品欧美国产一区二区三区| 99re热这里只有精品免费视频| 免费在线成人网| 日本不卡不码高清免费观看| 一级全黄少妇性色生活片| 国产精品18p| 免费黄色国产视频| 先锋资源在线视频| 超碰影院在线观看| 国产精品wwwww| 精品一区二区中文字幕| 国产青青在线视频| 国产精品专区在线| 四虎4hu永久免费入口| 免费精品视频一区二区三区| 国产在线a不卡| 99久久久久国产精品免费| 91欧美精品午夜性色福利在线| 日本视频久久久| 95av在线视频| 日韩av电影手机在线| 加勒比在线一区二区三区观看| 国产一区二区三区免费不卡| 欧美日韩视频在线一区二区| 一区二区三区免费| 日韩人在线观看| 欧美伊人久久久久久久久影院 | 阿v天堂2014| 国产精品815.cc红桃| 欧洲女同同性吃奶| 国产精品 欧美激情| 日本三级欧美三级| 波多野结衣电车| www.日韩高清| 韩国精品久久久| 福利一区二区在线| 91丨九色丨黑人外教| 91蝌蚪porny| 亚洲一区二区成人在线观看| 欧美亚洲一区二区在线| 精品1区2区在线观看| 色吧影院999| 日韩美女视频中文字幕| 国产精品一区二区三| 国产精品一区二区三区在线| 一区中文字幕在线观看| 日日干夜夜操s8| 精品人妻一区二区三区蜜桃视频| 中文字幕一区二区三区手机版| 中文字幕av无码一区二区三区| 亚洲av无码一区二区三区性色 | 国产乡下妇女三片| 三级欧美在线一区| av综合在线播放| 亚洲欧美区自拍先锋| 日韩视频123| 午夜精品久久久久久久99黑人| 成人免费在线网址| 青青青青在线视频| 无码人妻aⅴ一区二区三区| 色噜噜噜噜噜噜| 五月天婷婷在线观看| 国产欧美日韩不卡| 精品久久人人做人人爽| 97视频在线观看免费高清完整版在线观看| 电影午夜精品一区二区三区| 色哺乳xxxxhd奶水米仓惠香| 日本成年人网址| 国产一级在线免费观看| 久久97超碰国产精品超碰| 亚洲免费观看高清完整版在线观看 | 日韩久久久久久久久| 国产一区二区三区精品视频| 欧美性xxxxxxxx| 国产精品中文在线| 91亚洲国产精品| 一区二区三区四区亚洲| 欧美亚洲愉拍一区二区| 欧美极品少妇与黑人| 特大黑人娇小亚洲女mp4| 国产性猛交╳xxx乱大交| 国产亚洲美州欧州综合国| 久久久久久久国产精品视频| 男男做爰猛烈叫床爽爽小说| 亚洲精品成人少妇| 韩国v欧美v日本v亚洲| 日本一区二区欧美| 日韩www在线| 国产一二三区在线播放| 青草视频在线观看免费| 偷拍亚洲欧洲综合| 成人av资源网| 国产又黄又粗又猛又爽| 久久人人超碰精品| 日韩不卡在线观看| 国产精品视频导航| 免费看又黄又无码的网站| 国产污在线观看| 国产精品国产三级国产普通话对白| 国产精品初高中害羞小美女文| 日韩精品专区在线影院重磅| 亚洲v国产v| 久久久久成人片免费观看蜜芽| 91啦中文在线观看| 91精品国产综合久久久久久蜜臀| 亚洲无码久久久久久久| 亚洲人成电影在线观看天堂色| 日韩中文字幕a| 尤物视频一区二区| ww国产内射精品后入国产| 亚洲最快最全在线视频| 亚洲一二三精品| 视频在线一区二区| 亚洲自拍偷拍另类| 国产日本一区二区三区| **欧美大码日韩| 日韩少妇内射免费播放18禁裸乳| 国产精品1024| 久久久精品一区二区| 国产精久久久久久| 精品欧美一区二区在线观看| 欧美风情第一页| 国产视频一区二区三区在线观看| 国产精品啪视频| 国产成人精品亚洲| 国产在线精品一区二区中文| 久久久久久免费网| 日av在线播放中文不卡| 中文字幕天堂网| 日韩欧美999| 色综合久久五月| 99国产精品视频免费观看| 国产亚洲精品久久久优势| 国产第一页第二页| 久久久久亚洲精品| 粉嫩小泬无遮挡久久久久久| 日韩理论片在线观看| 欧美乱妇20p| 伊人久久一区二区| 欧美高清性xxxxhdvideosex| 亚洲精品视频在线看| 人妻大战黑人白浆狂泄| 亚洲精品国产免费| 性生交大片免费看l| 91在线精品一区二区| 久久久久久久久国产| 国产aⅴ爽av久久久久| 亚洲国产精品av| 99热亚洲精品| 中文无字幕一区二区三区| 美女扒开大腿让男人桶| 一区二区在线观看视频| 欧美少妇在线观看| 国产手机视频在线| 中文字幕在线精品| 女人黄色一级片| 亚洲人在线观看| 成年人看的免费视频| 欧美成人三级电影在线| 三级黄色在线视频| 久久精品女人的天堂av| 一区二区视频在线看| 国产在线视频在线| 久久影音资源网| 亚洲va综合va国产va中文| 亚洲成人精品视频| 欧美一区二区三区激情| 在线播放国产一区二区三区| 伊人成人在线观看| 国模精品一区二区三区| 亚洲综合av网| 懂色av成人一区二区三区| 黄色片在线免费| 情事1991在线| 狠狠综合久久av一区二区小说| 国产精品亚洲欧美在线播放| 国产成人手机视频| 亚洲国内精品视频| 国产毛片在线视频| 国产一级二级三级精品| 国产精品久久久久久久久免费相片| 精品综合久久久久| 亚洲精品国产欧美| 日本最新不卡在线| 欧美少妇一区| 国产拍揄自揄精品视频麻豆| 男人日女人下面视频| 日韩精品一区二区三区视频在线观看 | 在线欧美小视频| 国产大片中文字幕| 国产精品视频入口| 欧美喷水一区二区| 国产成人av一区二区三区在线观看| 极品盗摄国产盗摄合集| 色哺乳xxxxhd奶水米仓惠香| 欧美极品第一页| 日韩欧美在线网址| 中文字幕在线播放av| 欧妇女乱妇女乱视频| 日韩精品一区二区三区第95| 精品国产99久久久久久宅男i| 日本一区精品| 色综合欧美在线| 久艹视频在线观看| 国语精品免费视频| 亚洲自拍与偷拍| 午夜诱惑痒痒网| 久久综合九色九九| 国产精品热久久久久夜色精品三区| 国产97免费视频| 欧美图片激情小说| 欧美在线观看视频在线| 51自拍视频在线观看| 国产精品成人播放| 狠狠躁夜夜躁人人爽超碰91| aaa国产视频| 日本视频一区在线观看| 一二三区精品福利视频| 成人免费区一区二区三区| 久久久7777| 欧美在线激情视频| 亚洲丁香婷深爱综合| 中文字幕一区免费在线观看| 久久婷婷亚洲| 69xx绿帽三人行| 爱福利视频一区二区| 亚洲一区二区三区四区在线播放| 91麻豆精品国产91久久久久 | 国产精品69久久久久孕妇欧美| 日本一区二区三区免费看| 欧美美女一区二区| 亚洲人视频在线观看| 污色网站在线观看| 性欧美亚洲xxxx乳在线观看| caoporm超碰国产精品| 欧美日韩国产一二三区| 青青草成人免费在线视频| 91网站免费看| 欧美一区二区三区婷婷月色| 亚洲一区二区激情| 一区二区三区免费看| 亚洲精品日韩在线| 国产精品久久久久久久久晋中 | 久久综合伊人| 在线免费观看av网址| 波多野结衣av在线观看| 蜜桃福利午夜精品一区| 在线日韩av永久免费观看| 91黄色国产视频| 日本视频久久久| 亚洲人成电影网| 一区二区高清免费观看影视大全| 亚洲天堂2021av| 亚洲成人av免费观看| 欧美日韩综合另类| 久久免费精品视频| 一本大道久久a久久综合婷婷| 国产美女一区二区三区| 91麻豆国产视频| 午夜剧场高清版免费观看| 国产精品稀缺呦系列在线 | 婷婷国产成人精品视频| 欧美xxxxx少妇| 亚洲成人福利在线观看| 亚洲国产欧洲综合997久久| 欧美一级午夜免费电影| 香蕉视频免费看| 成年人在线免费看片| 香港三级韩国三级日本三级| 51国偷自产一区二区三区的来源| 国内精品国产三级国产在线专| 99久久精品国产精品久久| 丰满少妇xoxoxo视频| 91在线无精精品白丝| 成人黄色一区二区| 精品久久久久久久久久中文字幕| 一区二区在线观看网站| 亚洲福利av| 亚洲国产欧洲综合997久久 | 欧美日韩午夜视频| 一二三四国产精品| 91猫先生在线| 日韩欧美99| 激情视频一区二区| 精品无人国产偷自产在线| 欧美日韩激情小视频| 久久亚洲精华国产精华液 | 亚洲精品免费电影| 天天操天天操天天干| 奴色虐av一区二区三区| 精品国产青草久久久久96| 欧美男人天堂网| 青青草在线观看视频| 日韩中文字幕在线视频观看| 日本精品久久中文字幕佐佐木| 91精品国产福利在线观看| 欧美丝袜第一区| 亚洲高清视频的网址| 国产精品免费aⅴ片在线观看| 国产美女免费看| 一区二区伦理片| 亚洲av网址在线| 特级西西人体wwwww| 99久久人妻无码精品系列| 久久久久久久久久久久| 国产成人在线网址| 亚洲国产无线乱码在线观看| 香蕉视频911| 国产高清精品网站| 亚洲综合偷拍欧美一区色| 亚洲欧洲99久久| 欧美日韩视频在线| 欧美一区二区视频在线观看2020 |